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第 一 章 ”事件 的 概率 
1.1 概率 是 什么 


概率 ,又 称 或 然 率 ,几率 ,是 表示 茶 种 情况 (事件 ?出现 的 可 能 
性 大 小 的 一 种 数量 指标 , 它 介 于 0 与 1 之 间 . 

这 个 概念 笼统 地 说 起 来 很 容易 理解 ,但 若 从 理论 或 者 说 从 哲 
学 的 高 度 去 分 析 ,就 可 以 提出 一 大 堆 的 问题 .虽然 在 本 课程 范围 内 
我 们 不 必 去 深入 讨论 这 些 问题 的 各 个 方面 ,但 仍 希 望 ,通过 下 文 的 
叙述 ,使 谈 痢 对 "什么 是 概率 这 个 问题 ,有 一 个 较为 全 面 的 理解 . 


1.1.1 主观 概率 


甲乙 两 .本 四 人 一 早 进 城 去 办 事 , 要 傍晚 才能 回来 .为 了 决 

定 是 否 带 企 ,各 自在 出 发 前 ,对 
A = | 今天 下 午 6 时 前 不 会 下 雨 | 

这 个 情况 或 事件 发 生 的 可 能 性 大 小 作 个 估计 . 设 根 据 个 人 的 经 验 
和 目 信 ,甲乙 两、 本 分 别 把 这 一 可 能 性 估计 为 0,0.2,0.7 和 1. 
这 意味 着 甲 认为 事件 A 不 可 能 出 现 , 丁 认为 必然 出 现 , 乙 认 为 A 
出 现 的 可 能 性 是 有 的 ,但 很 小 ,而 再 认为 A 有 相当 大 的 可 能 性 出 
现 , 但 并 非 必然 .这 些 数字 反映 了 他 们 四 个 人 对 一 种 情况 的 主观 估 
计 , 故 称 为 主观 概率 .其 实际 后 果 是 ,例如 ,甲乙 决定 带 全 而 丙 、 丁 
则 否 . 

主观 概率 可 以 理解 为 一 种 心态 或 倾向 性 . 究 其 根 由 大 抵 有 二 : 
一 是 根据 其 经 验 和 知识 . 拿 上 例 来 说 , 若 某 人 在 该 城市 住 了 30 年 ， 
又 是 一 个 有 些 气 象 知识 的 人 ,他 在 作出 可 能 性 大 小 的 佑 计时 ,多 半 
会 使 用 这 些 经 验 和 知识 ,这 将 会 使 他 的 估计 较 易 为 人 所 相信 .从 这 
一 点 说 ,所 谓 主 观 概率 也 可 有 其 客观 背景 ,终究 不 同 于 信 口 雌 黄 . 
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二 是 根据 其 利害 关系 . 拿 上 例 来 说 ,在 对 某 人 而 言 下 十 并 不 会 运 成 
多 大 问题 而 这 华 又 增加 不 少 奴 舌 , 则 其 心态 将 倾 四 于 去 把 A 的 可 
能 性 高 佑 一 些 . 

主观 概率 的 特点 是 : 它 不 是 在 坚实 的 客观 理由 基础 上 为 人 们 
所 公认 的 ,因而 看 来 应 被 科学 所 否定 (科学 是 以 探讨 客观 真理 为 任 
务 的 ). 本 书 作 者 说 不 清楚 这 问题 该 如 何 全 面 地 去 理解 ,但 不 同意 
简单 的 全 盘 和 否定 的 态度 .理由 有 三 :中 这 个 概念 有 广泛 的 生活 基 
础 .我 们 几乎 无 时 不 在 估计 种 种 情况 出 现 的 可 能 性 如 何 , 而 不 同 的 
人 很 少 能 在 客观 的 基础 上 达成 一 致 . 包 这 可 能 反映 认识 主体 的 
一 种 倾 回 性 ,而 有 其 社会 意义 .例如 ， 若 问 三 年 后 经 济 形势 会 得 到 
根本 改善 的 可 能 性 大 小 怎样 , 则 不 同 经 济 状况 .社会 地 位 以 至 政 
治 倾 回 的 人 ,会 作出 有 差异 的 估计 .就 个 别 佑 计 而 言 可 能 谈 不 上 多 
大 道理 ,但 从 总 体 而 言 , 则 反映 了 社会 上 广大 群众 对 长 远 发 展 的 信 
心 如 何 .对 社会 学 家 乃至 决策 者 来 说 ,这 是 很 有 用 的 资料 . @ 在 涉 
及 利益 (经 济 和 其 他 的 ) 得 失 的 决策 问题 中 ,处 于 不 同 地 位 和 掌握 
情报 多 少 不 同 的 人 ,对 某 事件 可 能 性 大 小 要 参照 这 些 情况 及 可 能 
的 后 来 去 作 衡 量 .适合 于 某 人 的 决策 , 虽 则 风险 较 小 ,不 必 适 合 于 
太一 个 人 , 因 对 他 而 言 ,这 一 决策 可 能 风险 仍 太 大 .因此 ,主观 概率 
这 个 概念 也 有 其 实用 基础 .事实 上 ,许多 决策 都 难免 要 包含 个 人 判 
断 的 成 分 ,而 这 就 是 主观 概率 . 


1.1.2 试验 与 事件 


前 面 我 们 已 经 提 到 了 “事件 "这 个 名 词 .事件 是 什么 ? 在 通常 
的 意义 下 , 它 往往 是 指 一 种 已 发 生 的 情况 ,例如 某 某 空难 事件 ， 
1941 年 日 本 偷袭 珍珠 港 的 事件 之 类 .在 概率 论 中 则 不 然 ,事件 不 
是 指 已 发 生 了 的 情况 ,而 是 指 某 种 (或 某 些 ) 情 况 的 “陈述 ”. 它 可 能 
发 生 , 也 可 能 不 发 生 ,发 生 与 否 ,要 到 有 关 的 “试验 ”有 了 结果 以 后 ， 
才能 知晓 . 

拿 前 例 而 言 ,事件 A“ 陈 述 "* 了 这 样 一 种 情况 :下 午 6 时 前 不 
会 下 雨 .我 们 当然 并 未 说 这 已 发 生 了 . 它 是 否 发 生 ,要 等 试验 结果 ， 
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这 个 试验 ,就 是 对 到 下 午 6 时 前 的 天 气 情况 进行 观察 . 

推 而 广 之 ,我 们 就 不 难 明 白 : 在 概率 论 中 ， 事 件 一 词 的 一 般 
含义 是 这 样 的 : 

1. 有 一 个 明确 界定 的 试验 .试验 一 词 ,有 人 为 主动 的 意思 ,而 
像 上 例 那 样 , 人 只 处 在 被 动 地 位 ,只 是 记录 而 并 不 干预 气象 过 程 . 
这 类 情况 一 般 称 为 “观察 ”在 统计 学 中 ,这 一 分 别 有 时 有 实际 含 
义 ,但 对 目前 的 讨论 不 重要 ,可 以 把 试验 一 词 理 解 为 包含 了 观察 . 

2. 这 个 试验 的 全 部 可 能 结果 ,是 在 试验 前 就 明确 的 , 拿 上 例 
来 说 ,试验 的 全 部 可 能 结果 只 有 两 个 :其 一 是 A, 另 一 是 A= 1 今 
大 下 午 6 时 前 会 下 雨 ; .为 此 ,可 把 这 试验 写 为 (A,A). 不 必 等 到 
试验 完成 (不 必 到 下 午 6 时 ) 就 知道 : 非 A 即 A, 必 居 其 一 .又 如 ， 
投掷 一 个 赌博 用 的 角 子 这 个 试验 , 虽 无 法 预 政 其 结果 如 何 , 但 总 不 
外 平 是 “出 现 1 点 ”,……… ， 出 现 6 点 ”这 6 个 可 能 结果 之 一 ,因而 
不 妨 把 这 试验 简 记 为 (1 ,2,…,6). 

在 不 少 情况 下 ,我 们 不 能 确切 知道 一 试验 的 全 部 可 能 结果 ,但 
可 以 知 追 它 不 超出 某 个 范围 .这 时 ,也 可 以 用 这 个 范围 来 作为 该 试 
验 的 全 部 可 能 结果 . 如 在 前 例 中 , 若 我 们 感 兴趣 的 不 止 在 于 下 午 6 
时 前 是 否 下 雨 , 而 需要 记录 下 午 6 时 前 的 降雨 量 ( 如 以 毫米 为 单 
位 ), 则 试验 结果 将 是 非 负 实数 zx. 我 们 无 法 确定 x 的 可 能 取 值 的 
确切 范围 ,但 可 以 把 这 范围 取 为 [0, co) , 它 总 能 包含 一 切 可 能 的 试 
验 结果 ,尽管 我 们 明知 , 某 些 结果 ,如 zx >10000 ,是 不 会 出 现 的 .我 
们 甚至 可 以 把 这 范围 取 为 ( - co ,co ) 也 无 妨 .这 里 就 有 了 一 定 的 数 
学 抽象 , 它 可 以 带 来 很 大 的 方便 ,这 一 点 在 以 后 会 更 清楚 . 

3. 我 们 有 一 个 明确 的 陈述 ,这 个 陈述 界定 了 试验 的 全 部 可 能 
结果 中 一 确定 的 部 分 . 这 个 陈述 ,或 者 说 一 确定 的 部 分 ,就 叫做 一 
个 事件 .如 在 下 雨 的 例 中 ,A 是 全 部 可 能 结果 (4A,A) 中 确定 的 一 
部 分 .在 掷 仍 子 的 例 中 ,我们 可 以 定义 许多 事件 ,例如 

Ei = | 掷 出 偶数 点 | = (2,4,6) 
下 = { 掷 出 素数 点 | = (2,3,5) 
FE3 = | 掷 出 3 的 倍数 点 | = (3,6) 


等 等 ,它们 分 别 明确 地 界定 了 全 部 试验 结 末 的 集合 (1,2,…,6) 中 
的 一 个 相应 的 部 分 . 

如 果 我 们 现在 把 试验 做 一 次 , 即 把 这 蜗 子 投掷 一 次 . 则 当 投 掷 
结果 为 2, 或 为 4, 或 为 6 时 ,我 们 说 事件 E1 “发 生 了 ”, 不 然 就 说 事 
件 Ei 不 发 生 ”. 因此 ,我 们 也 可 以 说 :事件 是 与 试验 结果 有 关 的 一 
个 命题 ,其 正确 与 否 取决 于 试验 结果 如 何 . 

在 概率 论 上 ,有 时 把 单一 的 试验 结果 称 为 一 个 “基本 事件 ” 这 
样 ,一 个 或 一 些 基 本 事件 并 在 一 起 ,就 构成 一 个 事件 , 而 基本 事件 
本 身 也 是 事件 .在 据 山 子 的 例 中 ,有 1,2,…,6 等 6 个 基本 事件 . 事 
件 玉 ; 则 由 2,3,5 这 三 个 基本 事件 并 成 . 

设想 你 处 在 这 样 一 种 情况 :投掷 一 个 蜗 子 , 若 出 现 素数 点 , 则 
你 将 中 奖 . 则 在 货 子 投掷 之 前 你 会 这 样 想 :我 能 否 中 奖 ,取决 于 机 
遇 . 内 此 ,在 概率 论 中 , 常 称 事件 为 “随机 事件 ”或 “偶然 事件 ”“ 随 
机 的 意思 无 非 是 说 ,事件 是 否 在 某 次 试验 中 发 生 ,取决 于 机 遇 . 其 
极 妆 情况 ,是 “必然 事件 “在 试验 中 必然 发 生 的 事情 ,例如 ,| 掷 一 - 
个 仍 子 ,其 出 现 点数 不 超 过 6 和 和 “不 可 能 事件 ”( 在 试验 中 不 可 能 
发 生 的 事件 ) .这 两 种 情况 已 无 机 遇 可 言 ,但 为 方便 计 , 不 妨 把 它们 
视 为 随机 事件 的 特例 ,正如 在 微 积 分 中 ,常数 可 视 为 变量 的 特例 . 

可 以 把 必然 事件 和 不 可 能 事件 分 别 等 同 于 概率 为 1 和 概率 为 
0 的 事件 .从 严格 的 理论 角度 而 言 这 二 者 有 所 区 别 , 但 这 种 区 别 并 
无 实际 的 重要 性 . 

本 段 讲 的 概念 虽 很 浅显 ,但 是 很 重要 ,特别 提醒 读者 区 别 “ 事 
件 一 词 的 日 党 及 在 概率 论 中 的 不 同 含义 . 


1,1.3 古典 概率 


承接 上 一 段 .假定 某 个 试验 有 有 限 个 可 能 的 结果 e] ,es,…， 

en 假定 从 该 试验 的 条 件 及 实施 方法 上 去 分 析 , 我 们 找 不 到 任何 

理由 认为 其 中 某 一 结果 ,例如 e; , 比 任 一 其 他 结果 ,例如 e;, 时 具有 

优势 ( 即 更 倾向 于 易 发 生 ), 则 我 们 只 好 认为 ,所 有 结果 ei1,… ,ev 

在 试验 中 有 同等 可 能 的 出 现 机 会 , 即 1ZN 的 出 现 机 会 . 常常 把 这 
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样 的 试验 结果 称 为 “等 可 能 的 ”. 

拿 掷 仍 子 的 例子 而 言 , 如 果 中 仍 子 质料 绝对 均匀 .四 人 骸 子 是 绝 
对 的 正六 面体 . 仿 掷 货 子 时 离 地 面 有 充分 的 高 度 , 则 一 般 人 都 会 同 
意 ,其 各 面 出 现 的 机 会 应 为 等 可 能 . 当然 ,在 现实 生活 中 这 只 能 是 
一 种 近似 ,何况 ,在 山子 上 刻 上 点 数 也 会 影响 其 对 称 性 . 

在 “等 可 能 性 ”概念 的 基础 上 ,很 自然 地 引进 古典 概率 的 定义 ， 

定义 1.1 设 一 个 试验 有 NN 个 等 可 能 的 结果 ,而 事件 下 恰 包 
含 其 中 的 M 个 结果 , 则 事件 五 的 概率 , 记 为 P(E), 定 义 为 

P(E) = M/N (1.1) 

本 定义 所 根据 的 理由 很 显然 . 按 前 面 的 分 析 ,由 等 可 能 性 的 含 
义 ,每 个 结果 的 概率 同 为 1 人 N. 今 事件 玉 包 含 M 个 结果 ,其 概率 
理应 为 1/N 的 M 倍 , 即 MAN .古典 概率 是 “客观 ”的 . 因为 ,如 果 
等 可 能 性 是 基于 客观 事实 (例如 在 骨 子 绝对 均匀 日 为 严格 正六 面 
体 时 ) 而 非 出 于 主观 设想 , 则 看 来 除 按 (1.1) 式 外 , 别 无 其 他 的 合理 
定义 法 .因此 在 等 可 能 性 的 前 提 下 ,(1.1) 式 应 为 大 家 所 公认 .这 
样 ,关键 就 在 于 保证 这 等 可 能 性 成 立 无 误 .在 开奖 时 要 设计 适当 的 
方法 并 设置 公证 人 ,这 些 措施 都 是 为 了 保证 所 用 方法 导致 等 可 能 
的 结果 . 

设 有 一 个 坛子 ,其 中 包含 N 个 大 小 和 质地 完全 一 样 的 球 , M 
个 为 日 球 ,NN - M 个 为 黑 球 .将 这 N 个 球 彻底 扰 乱 , 蒙 上 眼睛 ,从 
中 抽出 一 个 . 则 人 们 都 能 接受 :“ 抽 到 白 球 ” 这 个 事件 的 概率 ,应 取 
为 MAN .这 个 “坛子 模型 "看 起 来 简单 却 很 有 用 : 它 是 在 一 切 概率 
的 讨论 中 ,唯一 的 一 个 易于 用 形象 的 方法 加 以 体现 的 情况 .日 常 习 
用 的 按 抽签 来 保证 机 会 均等 的 做 法 ,就 是 基于 这 一 模型 .有 了 这 
一 模型 ,我 们 可 以 把 一 些 难 于 理解 的 概率 形象 化 起 来 而 获得 感性 . 
如 在 “下 雨 那个 例 中 ,说 乙 估 计 事 件 A 的 概率 为 0.20, 这 上 听 起 来 
不 其 了 然 和 不 好 理解 .但 如 乙 说 “我 认为 A 发 生 的 机 会 ,正如 在 4 
染 球 1 日 球 中 ,抽出 白 球 的 机 会 ”, 则 人 们 就 感到 顿时 领悟 了 他 的 

古典 概率 的 计算 主要 基于 排列 组 合 ,将 在 下 一 节 举 一 些 例子 
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来 说 明 . 这 个 名 称 的 来 由 是 远 自 16 世纪 以 来 ,就 有 一 些 学 者 研究 
了 使 用 仍 子 等 赌 具 进行 赌博 所 引起 的 “机 会 大 小 "的 问题 ,由 此 结 
晶 出 概率 论 的 一 些 最 基本 的 概念 ,如 用 (1.1) 式 定义 的 概率 (赌博 
中 各 种 结果 自 应 公认 为 等 可 能 的 ) 及 数学 期 望 ( 见 下 章 ) 等 .其 中 一 
个 著名 的 问题 是 “分 赌 本 问题 ”. 在 下面 已 简化 了 的 例 中 ,我 们 来 看 
看 ,使 用 古典 概率 的 概念 ,如 何 使 这 个 问题 达到 一 个 公正 的 解决 . 

例 1.1 甲乙 两 人 赌 技 相同 ,各 出 赌注 500 元 . 约定 : 谁 先 胜 
三 局 , 则 谁 拿 走 全 部 1000 元 . 现 已 赌 了 三 局 , 甲 二 胜 一 负 而 因 故 要 
中 止 赌博 , 问 这 1000 元 要 如 何 分 , 才 算 公平 ? 

平均 分 对 甲 欠 公平 ,全 归 甲 则 对 乙 欠 公平 .合理 的 分 法 是 按 一 
定 比例 而 甲 拿 大 头 .一 种 看 来 可 以 接受 的 方法 是 按 已 胜局 数 分 , 即 
甲 拿 2 , 乙 拿 143. 仔 细 分 析 ,发 现 这 不 合理 ,道理 如 下 :设想 继续 
赌 两 局 , 则 结果 无 非 以 下 四 种 情况 之 一 : 

甲 甲 ,甲乙 , 乙 甲 , 乙 乙 ， (1.2) 

其 中 “甲乙 ”表示 第 一 局 甲 胜 第 二 局 乙 胜 , 余 类 推 .把 已 赌 过 的 三 局 
与 (1.2) 中 这 四 个 结果 结合 ( 即 甲 . 乙 赌 完 五 局 ) ,我 们 看 出 :对 前 三 
个 结果 都 是 甲 先 胜 三 局 ,因而 得 什 元 ,只 在 最 在 一 个 结果 才 由 乙 得 
什 元 .在 赌 技 相 同 的 条 件 下 ,(1.2) 中 的 四 个 结果 应 有 等 可 能 性 . 因 
此 ,甲乙 最 终 获 胜 可 能 性 大 小 之 比 为 3:1. 全 部 赌 本 应 按 这 上 比例 
分 , 即 甲 分 750 元 , 乙 分 230 元 , 才 算 公正 合理 . 

这 个 例子 贤 给 人 局 发 , 即 表 面 上 看 来 简单 自然 的 东西 ,经 过 深 
入 一 层 的 分 析 而 揭示 了 其 不 合理 之 处 .这 个 例子 还 和 重要 的 “数学 
期 望 的 概念 相关 , 见 第 二 章 . 

古典 概率 的 局 限 性 很 显然 : 它 只 能 用 于 全 部 试验 结果 为 有 限 
个 , 且 等 可 能 性 成 立 的 情况 .但 在 某 些 情况 下 ,这 概念 可 稍稍 引申 
到 试验 结果 有 无 限 多 的 情况 ,这 就 是 所 谓 “ 几 何 概 率 ”. 举 一个 例 
子 . 


例 1.2 甲乙 二 人 约定 1 点 到 2 点 之 间 在 某 处 碰头 ,约定 先 

到 者 等 候 10 分 钟 即 离 去 .设想 甲乙 二 人 各 自 随意 地 在 1 一 2 点 之 

则 选 一 个 时 刻 到 达 该 处 , 问 “ 甲 乙 二 人 能 磁 上 ”这 事件 的 概率 是 
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多 少 ? 

以 1 点 钟 作 原点 ,一 分 为 单位 ， 
把 甲乙 到 达 时 间 x ,yy 构成 的 点 4z， 
y) 标 在 直角 坐标 系 上 . 则 图 1.1 中 的 
正方 形 OABC 内 每 个 点 都 是 一 个 可 
能 的 试验 结果 ,而 这 个 正方 形 就 是 全 . 
部 可 能 的 结果 之 集 .“ 甲 乙 二 人 各 自 
随意 地 在 1 一 2 点 之 间 选 一 个 时 刻 到 
达 该 处 ”一 语 , 可 以 理解 为 这 正方 形 
内 任 一 点 都 是 等 可 能 . 按 约定 ,只 有 图 1.1 
在 点 (zy,y) 落 在 图 中 的 多 边 形 
OFGBHI 内 时 ,事件 巨 才 发 生 . 因 正方 形 内 包含 无 限 个 点 ,古典 概 
率 定义 (1.1) 无 法 使 用 .于 是 ,我 们 把 “等 可 能 性 ”这 概念 按 本 问题 
特点 引申 一 下 :正方 形 内 同样 的 面积 有 同样 的 概率 .全 正方 形 的 面 
积 为 60 二 3600, 而 易 算出 上 述 多 边 形 的 面积 为 1100. 按 上 述 引 申 
了 原则 ,算出 事件 的 概率 为 P(E)=1100/3600= 11/36. 

这 样 算出 的 概率 称 为 “几何 概率 ”, 因 它 是 基于 几何 图 形 的 长 
度 .面积 .体积 等 而 算出 的 .就 本 例 而 言 ,重要 之 点 在 于 把 等 可 能 性 
解释 或 引申 为 “等 面积 ,等 概率 ”. 其 他 一 些 可 用 几何 概率 处 理 的 问 
题 ,都 需要 作 类 似 的 引申 .在 某 些 较 复杂 的 问题 中 , 几 种 引申 看 来 
都 可 接受 ,由 此 可 算出 不 同 的 结果 .这 并 无 矛盾 可 言 ,因为 每 一 种 
不 同 的 引申 ,意味 着 对 “等 可 能 性 ”的 含义 作 不 同 的 解释 . 问题 在 于 
哪 一 种 解释 最 符合 你 的 问题 的 实际 含义 . 


1.1.4 概率 的 统计 定义 


从 实用 的 角度 看 ,概率 的 统计 定义 无 非 是 一 种 通过 实验 去 佑 

计 事件 概率 的 方法 . 拿 掷 骨 子 这 个 例子 来 说 ,和 看 髓 子 并 非 质 地 均 

匀 的 正方 体 , 则 投掷 时 各 面 出 现 的 概率 不 必 相 同 .这 时 ， 出 现 么 

点 ”这 个 事件 Ei 的 概率 有 多 大 ,已 无 法 仅 通 过 一 种 理论 的 考虑 来 

确定 .但 我 们 可 以 做 实验 :反复 地 将 这 山子 投 据 大 量 的 次 数 , 例 如 
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nn 次 . 若 在 这 77 次 投掷 中 么 共 出 现 mm 次 , 则 称 mi/n 是 已 | 这 个 
事件 在 这 次 试验 (每 次 投 毛 算 作 一 个 试验 ) 中 的 “频率 ” .概率 的 
统计 定义 的 要 旨 是 说 ,就 拿 这 个 频率 mi 作为 事件 EE| 的 概率 
P(E) 的 估计 .这 个 概念 的 直观 背景 很 简单 :一 事件 出 现 的 可 能 性 
大 小 ,应 由 在 多 次 重复 试验 中 其 出 现 的 频繁 程度 去 刻画 . 

一 般 的 情况 与 此 毫 无 区 别 , 只 须 在 上 文 的 叙述 中 ,把 “ 掷 咒 子 ” 
改换 成 某 个 一 般 的 试验 ,而 把 "出现 么 点 "这 事件 五 ; 改换 成 某 个 
指定 的 事件 即 可 .要 点 在 于 :该 试验 必须 能 在 同样 条 件 下 大 量 次 数 
重复 施行 ,以 便 我 们 有 可 能 观察 该 事件 的 频率 . 

读者 钨 怕 已 注意 到 上 述 定 义 中 的 不 足 之 处 , 即 频率 只 是 概率 
的 估计 而 非 概 率 本 身 .形式 上 可 以 用 下 面 的 说 法 来 解脱 这 个 困难 . 
把 事件 五 的 概率 定义 为 具有 如 下 性 质 的 一 个 数 p: 当 把 实验 重复 
时 ,的 频率 在 p 的 附近 摆动 , 且 当 重复 次 数 增 大 时 ,这 探 动 愈 来 
愈 小 .或 者 于 脆 说 :概率 就 是 当 试 验 次 数 无 限 增 大 时 频率 的 极限 . 
要 这 样 做 ,就 必须 回答 下 述 问题 :你 怎样 去 证 明 具 有 上 述 性 质 的 数 
Zp 存在 ,抑或 p 的 存在 只 是 一 个 假定 ? 

依 本 书 作者 的 观点 ， 概 率 的 统计 定义 ”的 重要 性 ,不 在 于 它 提 
供 了 一 种 定义 概率 的 方法 一 一 它 实 际 上 没有 提供 这 种 方法 ,因为 
你 永远 不 可 能 依据 这 个 定义 确切 地 定 出 任何 一 个 事件 的 概率 .其 
重要 性 在 于 两 点 :一 是 提供 了 一 种 估计 概率 的 方法 ,这 在 上 文 已 谈 
到 了 ,这 种 应 用 很 多 .例如 在 人 口 的 抽样 调查 中 ,根据 抽样 的 一 小 
部 分 人 去 估计 全 部 人 口 的 文盲 比例 ;在 工业 生产 中 ,依据 抽取 的 一 
些 产品 的 检验 结果 去 估计 产品 的 废品 率 ; 在 医学 上 依据 积累 的 资 
料 去 估计 某 种 疾病 的 死亡 率 等 . 二 是 它 提 供 了 一 种 检验 理论 正确 
忆 否 的 准则 .设想 根据 一 定 的 理论 ,假定 等 等 算出 了 某 事 件 A 的 
概率 为 p ,这 理论 或 假定 是 否 与 实际 相符 ?我们 并 无 把 握 .于 是 我 
们 可 诉 诸 实验 , 即 进行 大 量 重复 的 试验 以 观察 事件 A 的 频率 m/ 
2. 右 mjm 与 p 接近 , 则 认为 实验 结果 支持 了 有 关 理 论 , 若 相去 较 
远 , 则 认为 理论 可 能 有 误 . 这 类 问题 属于 数理 统计 学 的 一 个 重要 分 
支 假设 检验 ,将 在 本 书 第 五 章 中 讨论 . 
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1.1.5 概率 的 公理 化 定义 


数学 上 所 说 的 “公理 ” ,就 是 -一 些 不 加 证 明 而 承认 的 前 提 . 这些 
前 提 规 定 了 所 讨论 的 对 象 的 一 些 基本 关系 和 所 满足 的 条 件 , 然 后 
以 之 为 基础 ,推演 出 所 讨论 的 对 象 的 进一步 的 内 容 . 几何 学 就 是 一 
个 典型 的 例子 . 

成 功 地 将 概率 论 实现 公理 化 的 ,是 现代 前 苏联 大 数学 家 柯 尔 
莫 哥 洛 夫 ,时 间 在 1933 年 .值得 赞赏 的 不 止 在 于 他 实现 了 概率 论 
的 公理 化 ,还 在 于 他 提出 的 公理 为 数 很 少 且 极 为 简单 ,而 在 这 么 一 
个 基础 上 建立 起 了 概率 论 的 宏伟 大 厦 . 

在 第 1.1.2 段 中 我 们 曾 指 出 :事件 是 与 试验 相连 ,试验 有 许多 
可 能 的 结果 ,每 个 结果 叫做 一 个 基本 事件 . 与 此 相应 ,在 柯 氏 的 公 
理 体 系 中 引进 一 个 抽象 的 集合 2 ,其 元 素 w 称 为 基本 事件 .我 们 
又 曾 指出 :一 个 事件 是 由 若干 基本 事件 构成 .如 在 掷 仍 子 的 试验 
中 ， 掷 出 素数 点 "这 个 事件 ,由 2,3,$ 这 三 个 基本 事件 构成 .与 此 
相应 ,在 柯 氏 公理 体系 中 考虑 由 2 的 子 集 (包括 CQ 本 身 及 空 
多) 构成 的 一 个 集 类 钞 了 了 不 必 包 括 0 的 一 切 可 能 的 子 集 , 且 必 须 
满足 某 种 我 们 在 此 不 必 仔 细 说 明 的 条 件 . 交 中 的 每 个 成 员 就 称 为 
“事件 .事件 有 概率 ,其 大 小 随 事 件 而 异 , 换 名 话说 ,概率 是 事件 的 
函数 .与 此 相应 ,在 柯 氏 公理 体系 中 ,引进 了 一 个 定义 在 多 上 的 也 
数 已. 对 了 中 任 一 成 员 A ,P(A ) 之 值 理解 为 事件 A 的 概率 . 柯 氏 
公理 体系 对 这 个 图 数 已 加 上 了 几 条 要 求 ( 即 公理 ):GD0O 委 P(A) 迄 
1 对 多 任何 成 员 A ,这 相应 于 要 求 概 率 在 0,1 之 间 .@P(O)=1， 
P( 名 )=0. 这 相应 于 说 必然 事件 有 概率 1, 不 可 能 事件 有 概率 0. 
加 法 公理 .这 一 条 将 在 1.3 节 中 解释 . 

我 们 举 一 个 简单 例子 来 说 明 柯 氏 公 理 的 实现 ,就 是 那个 “ 描 骨 
子 ”的 例子 .在 本 例 中 ,集合 0 = 11,2,3,4,5,6| ,由 6 个 元 素 构成 ， 
反映 撕 骨 子 试验 的 6 个 基本 结果 .作为 了 ,在 本 例 中 包含 0 的 一 切 
可 能 的 子 集 , 故 多 一 共有 64 个 成 员 . 至 于 概率 上 男 数 已 的 定义 , 则 
要 考虑 角子 的 具体 情况 , 吞 骨 子 是 均匀 的 正 立 方 体 , 则 PP 定义 为 
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P(A) = A 中 所 含 点 数 /6 
若 仍 子 非 均匀 , 则 每 面 的 出 现 概率 p1,…, pse 可 不 同 .这 时 , 先 定 
出 上 面 这 6 个 数 ,然后 对 每 个 A ,把 其 中 所 含 点 相应 的 p 值 加 起 
来 作为 P(A ). 例 如 ,车 A=12,3,5), 则 P(A)= ps,+ ps3+ps. 

由 这 个 例子 我 们 也 看 出 : 柯 氏 公理 只 是 介 定 了 概率 这 个 概念 
所 必须 满足 的 一 些 一 般 性 质 , 它 没有 也 不 可 能 解决 在 特定 场合 下 
如 何 定 出 概率 的 问题 . 拿 后 一 例子 而 言 ,如 何以 足够 的 精确 度 定 出 
p1，…, pe, 那 是 要 作 大 量 艰苦 的 工作 的 . 柯 氏 公理 的 意义 在 于 它 
为 一 种 普遍 而 严格 的 数学 化 概率 理论 奠定 了 基础 .例如 ,刚才 讨论 
过 的 这 个 例子 可 用 于 任何 一 个 只 有 6 个 基本 结果 的 试验 ,而 无 须 
过 问 这 试验 是 掷 仍 子 或 其 他 .这 就 是 数学 的 抽象 化 . 正如 我 们 可 说 
1+2=3, 而 不 必要 去 讨论 一 只 牛 加 二 只 牛 等 于 三 只 牛 之 类 的 东 
西 . 


1.2 古典 概率 计算 
1.2.1 排列 组 合 的 几 个 简单 公式 


按 公 式 (1.1) ,古典 概率 计算 归结 为 计算 两 个 数 M 和 NN .这 种 
计算 大 多 涉及 排列 组 合 . 二 者 的 区 别 在 于 ,排列 要 计较 次 序 而 组 合 
不 计较 :ab 和 ba 是 不 同 的 排列 ,但 是 是 相同 的 组 合 . 

1.7 个 相 异 物件 取 r 个 (1 三 7 二) 的 不 同 排列 总 数 ,为 

P* = n(n m1)(n -2)…(n-r+1) (2.1) 

因为 ,从 个 中 取出 排列 中 的 第 1 个 ,有 ?2 种 取 法 .在 剩 下 的 
n 一 1 个 中 取出 一 个 ,作为 排列 中 的 第 2 个 ,有 n 一 1 种 取 法 …… . 
最 后 ,在 剩 下 的 n 一 r+1 个 中 取出 一 个 作为 排列 中 的 第 + 个 ,有 
2 一 r+1 种 取 法 .因此 不 同 的 取 法 数目 为 n,n 一 1,…,n 一 r+1 
这 7 个 数 之 积 , 从 而 得 出 公式 (2.1). 

例如 ,从 a,5b,c,d 这 4 个 文字 中 取 两 个 作 排列 ,有 4x3=12 
种 : 

ab,pbayacy ca aa ,da ,pccp ,pa ,db,ca ,dc. 
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特别 , 若 半 =, 由 (2.1) 得 
Pr = rr 一 1 1 = 了 | (2.2) 
r! 读 为 “> 阶乘 ”, 是 前 vr 个 自然 数 之 积 . 人 们 常 约定 把 0! 作为 
1. 当 r 不 是 非 负 整数 时 ,记号 r1 没有 意义 . 
2.7 个 相 异 物件 取 7 个 ( 委 r 委 2 ) 的 不 同 组 合 总 数 ,为 
Cr? = Pr/r!l = nl/(r!(n — rr)!) (2.3) 
因为 ,每 一 个 包含 > 物件 的 组 合 , 可 以 产生 r! 个 不 同 的 排列 . 故 
排列 数 应 为 组 合 数 的 x1 倍 , 由 此 得 出 公式 (2.3). C” 常 称 为 组 合 
系数 . 
例如 ,从 a,5b,c,d 这 4 个 文字 中 取 2 个 作 组 合 . 有 41 / 
(21 21)=6 种 , 即 a6 ,ac,ad ,Bc ,bd ,cd. 
在 有 些 书籍 中 把 记号 C? 写 为 C’.C? 的 一 个 更 通用 的 记号 是 


[”] 我 们 今后 将 用 ”取代 Cy. 当 + = 0 时 , 按 01 = 1 之 约定 ,由 


(2.3) 算出 | ) = 1, 这 可 看 作 一 个 约定 .对 组 合 系数 另 一 常用 的 
("= n(n 一 1) (2 一 和 二 1)Arl 


只 要 > 为 非 负 整 数 ,n 不 论 为 任何 实数 ,都 有 意义 . 故 ”可 不 必 限 
制 为 自然 数 .例如 , 按 上 式 , 有 
(= DCD DA CD 
3. 与 二 项 式 展开 的 关系 
组 合 系数 [" 又 常 称 为 二 项 式 系数 ,因为 它 出 现在 下 面 熟 知 
的 二 项 式 展开 的 公式 中 


(a+6)" = >| 


i=0 


" ja (2.4) 
2 


这 个 公式 的 证 明 很 简单 :因为 ,(a+6)"”=(a+6b)":(a+6)…(a+t 
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站 ) .为 了 产生 aw” ' 这 一 项 ,在 这 个 (a +5) 中 ,要 从 其 中 的 i 个 
取出 a, 另 一 7 个 取出 56. 从 妈 个 中 取出 i 个 的 不 同 取 法 为 {”]， 
这 也 就 是 ap*-i 这 一 项 的 系数 . : 

利用 关系 (2.4) 可 得 出 许多 有 用 的 组 合 公 式 .例如 ,在 (2.4) 中 


令 a= 二 5 一 1, 得 


令 a= 一 1,2=1, 则 得 


(0G) (=0 


为 一 个 有 用 的 公式 是 


ea 0 


它 是 由 便 等 式 (1+Zz) "=(1+ zx)™(1+x)” 即 
人 
7=0 了 i=0 \J i=0 \J 
比较 两 边 的 x* 项 的 系数 得 到 的 . 
4.72 个 相 异 物件 分 成 k 堆 , 各 堆 物 件数 分 别 为 1,… ,rs 的 分 
法 是 
nil/(rilr,!) (2.6) 
此 处 x ,… ,rs 都 是 非 负 整数 ,其 和 为 n ,又 这 里 要 计较 堆 的 次 序 . 
就 是 说 ,和 奉 有 5 个 物体 a,6b5,c,d,e 分 成 3 堆 , 则 (ac),(ad), (be) 
和 (be),(ac),(q) 是 算 作 两 种 不 同 分 法 . 


1 
证 明 很 简单: 先 从 ”个 中 取出 ri 个 作为 第 1 堆 , 取 法 有 | ”| 
| 


种 .在 余下 的 7 一 ri 个 中 取出 ~ 个 作为 第 2 只 , 取 法 有 | 和 
rT? ! 
种 ,以 此 类 推 ,得 到 全 部 不 同 的 分 法 为 


"12 。 


n nN rl nr ?ry | 
ri] 六 2 三 3 rp 


利用 公式 (2.3) 并 注意 nn 一 一:… 一 -1 三 7i, 即 得 (2.6) 
(2.6) 常 称 为 多 项 式 系 数 ,因为 它 是 (xj1+… + xr)” 的 展开 式 
中 ,zx 这 一 项 的 系数 . 


1.2.2 古典 概率 计算 举例 


例 2.1 一 批 产 品 共 N 个 ,其 中 废品 有 M 个 . 现 从 中 随机 
(或 说 随意 ) 取 出 个 , 问 “其 中 恰好 m 个 废品 "这 个 事件 E 的 概 
率 是 多 少 ? 

按 1.2.1 所 述 , 从 NN 个 产品 中 取出 个, 不同 的 取 法 有 
| 种 .所 谓 “ 随 机 ”或 “随意 ” 取 , 是 指 这 (») 种 取 法 有 等 可 能 


n 
性 .这 是 古典 概率 定义 可 以 使 用 的 前 提 . 所 以 ,从 实际 的 角度 言 , 问 
题 在 于 怎样 保证 抽取 的 方法 能 满足 等 可 能 性 这 个 要 求 . 以 下 各 例 
中 “随机 一 词 也 都 是 作 这 种 理解 . 
使 事件 五 发 生 的 取 法 ,或 者 说 “有利 于 事件 五 的 取 法 ,计算 


如 下 :从 M 个 废品 中 取 个 , 取 法 有 | ， 种 .从 其 余 N - M 个 合 
TIN- M 
符 品 中 取 ~ 六 个 , 取 法 有 { ， “种 . 故 有 利于 事件 下 的 取 


法 ,共有 | ”| |， ) 种 . 按 公式 (1.1) ,得 事件 巨 的 概率 为 


人。 er 


nm nn 
这 里 要 求 六 <M,2 一 m 志 NN -~ M ,否则 概率 为 0( 因 E 为 不 可 能 
事件 ). 
例 2.2 7 双 相 异 的 鞋 共 2n 只 ,随机 地 分 成 堆 , 每 礁 2 只 . 
问 “各 堆 都 自 成 一 双 鞋 "这 个 事件 EE 的 概率 是 多 少 ? 
把 2” 只 鞋 分 成 堆 每 堆 2 只 的 分 法 , 按 公式 (2.6), 有 N = 
四 13 » 


(272)1 /2" 种 .有 利于 事件 EE 的 分 法 可 计算 如 下 :把 每 双 土 各 目 
绑 在 一 起 看 成 一 个 物体 ,然后 把 这 相 异 的 n 个 物体 分 成 n 堆 , 每 
堆 1 件 . 按 公式 (2.6), 分 法 有 M=n1 种 .于 是 

P(E) = M/AN = 1127/(2n)! = 1/(2n -1)11 
a11 这 个 记号 对 奇 自然 数 定 义 :a!1!f 二 1'3.5…a, 即 所 有 不 超过 
a 的 奇数 之 积 . 

男 一 种 算法 如 下 ;把 这 2n 只 鞋 自 左 至 右 排 成 一 列 ( 排 法 有 
(2n)! 种 ), 然 后 ,把 处 在 1,2 位 置 的 作为 一 堆 ,3,4 位 置 的 作为 一 
堆 ,等 等 . 为 计算 使 事件 五 发 生 的 排列 法 ,注意 第 工 位 置 可 以 是 这 

只 鞋 中 的 任 一 只 ,其 取 法 有 2n 种 .第 1 位 置 取 定 后 ,第 2 位 置 
只 有 一 种 取 法 , 即 必 须 取 与 第 1 位 置 的 鞋 配 成 一 双 的 那 一 只 . 依 此 
类 推 , 知 奇 数位 置 依次 有 2n ,2n 一 2,2n 一 4,…,2 种 取 法 ,而 偶数 
位 置 则 都 只 有 1 种 取 法 .所 以 ,有 利于 事件 玉 的 排列 总 数 为 27 
(27 一 2)…:2= 二 2”n1, 而 
P(E) = 2"n!/(2n)! 
与 前 面 用 为 外 的 方法 算出 的 相同 . 

例 2.3 zn 个 男孩 ,mm 个 女孩 (mm 三 n+ 1) 随机 地 排 成 一 列 . 
问 任意 两 个 女孩 都 不 相 邻 这 个 事件 五 的 概率 是 什么 ? 

把 n+m 个 孩子 随意 排列 , 总 
共有 N=(2+ 了 2)!1 种 不 同 的 排 

图 1.2 法 .有 利于 事件 王 发生 的 排 法 可 计 

算 如 下 : 先 把 ”个 男孩 子 随意 排 成 

一 列 ,总 共有 n! 种 方法 . 排 定 以 后 ,每 两 个 相 邻 男孩 之 间 有 一 位 
置 , 共 有 2-1 个 ;加 上 头 尾 两 个 位 置 , 共 交 +1 个 位 置 (图 1.2 画 
出 了 2=3 的 情况 ，x ”表示 男孩 ,4 个 “7 表示 刚才 所 指出 的 + 
1I=4 个 位 置 ). 为 了 使 两 个 女孩 都 不 相 邻 ,必须 从 这 +1 个 位 置 


中 取出 mz 个 放 女孩 . 取 法 有 ” 7 种 . 取 定位 置 后 ,mz 个 女孩 
子 尚 可 在 这 zm 个 取 定 位 置 上 随意 排列 ,方法 有 加 ! 种 .由 此 推出 ， 


O—X—0—X——0O—X—© 
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? 1 
有 利于 事件 发 生 的 排列 数 为 M = 1 |”” jw! ,因此 ， 


P(E) = 本 人 je | Wait + m 


771 771 

如 果 这 n+ ni 个 孩子 不 是 排 成 一 直线 而 是 排 在 一 图 图 上 , 则 
同一 事件 的 概率 是 多 少 ? 初 一 看 以 为 无 所 区 别 , 其 实 不 然 .看 
图 1.2, 夺 以” x“ 和 “Cc" 分 别 表 男 .女孩 , 则 在 一 直线 上 首尾 两 女孩 
并 不 相 邻 .但 吞 把 这 直线 弯 成 一 个 圆圈 , 则 首尾 两 女 护 成 为 相 邻 
了 ,因此 算法 略 有 有 不同. 我们 留 给 读者 去 证 明 : 管 案 为 


的 的 
pi 1! 


mn 

例 2.4 一 个 人 在 口袋 里 放 2 金 火柴 ,每 盒 n 支 . 每 次 抽烟 时 
从 口袋 中 随机 拿 出 一 盒 ( 即 每 次 每 盒 有 同等 机 会 被 拿 出 ) 并 用 掉 一 
支 .到 某 次 他 迟早 会 发 现 : 取 出 的 那 一 盒 已 空 了 . 问 :“ 这 时 另 一 盒 
中 恰好 有 m 支 火柴 ”的 概率 是 多 少 ? 

解法 1 我 们 来 考察 最 初 22+1- 和 2 次 抽 用 的 情况 ,每 次 抽 
用 时 有 2 种 方法 (抽出 甲 盒 或 乙 盒 ). 故 总 的 不 同 抽 法 ,有 22*+1-” 
种 . 有 利于 所 述 事件 的 抽 法 可 计算 如 下 : 先 看 “最 后 一 次 ( 即 第 27 
+1 一 m 次 ) 是 抽出 甲 盒 ”的 情况 .为 使 所 述 事件 发 生 ,在 前 2n - 
次 中 ,必须 有 nn 次 抽 用 甲 盒 ,实现 这 一 点 不 同 的 抽 法 为 


2717 一 mm 
[™ | . 类 似 地 ,最 后 一 次 是 抽出 乙 盒 "的 抽 法 也 有 这 么 多 ， 


277 一 77; 


玫 有 利于 所 述 事 件 的 全 部 抽 法 为 2 ” ) ,而 事件 的 概率 


2 人 本 ™ /2 一 - [” 2 /2 (2.8) 
n | nt 


解法 2 因 每 盒 中 只 有 n 支 , 最 晚 到 第 2z + 1 次 抽取 时 ,或 
在 此 之 前 , 必 发 现 抽出 的 盒子 已 空 .故我 们 不 管 结果 如 何 ,总 把 试 
验 做 到 抽 完 第 2n +1 次 为 止 ,不同 的 抽 法 有 2”*! 种 . 
现在 计算 有 利于 所 述 事件 的 抽 法 . 仍 如 前 , 先 考虑 “ 先 发 现 甲 
四 15 : 


盒 为 空 " 的 抽 法 有 多 少 . 这 必然 是 对 某 个 rr=0,1, ,7 一 7 以 


下 情况 同时 出 现 : 
1” 第 2+r 次 抽取 时 抽出 甲 盒 ,而 这 时 甲 盒 已 是 第 n 次 被 
抽出 ; 
2” 前 n+r 一 1 次 抽取 时 , 乙 盒 被 抽出 7 次 (这 不 同 的 抽 法 
2 十 六 一 1] 
有 j 种 ): 


r 
3 紧 接着 的 2 一 ML 一 7 次 全 是 抽出 乙 盒 ; 

4 ”第 2n 一 m+1 次 抽取 时 抽出 甲 盒 (这 时 发 现 它 已 空 , 且 乙 
盒 恰 有 m 文 ); 

5” 最 后 m 次 抽取 结果 可 以 任意 (这 不 同 的 抽 法 有 2” 种). 


综合 上 述 , 对 固定 的 ~, 抽 法 有 [” ltr 
利于 事件 发 生 , 且 先 发 现 甲 盒 为 空 "的 抽 法 ,有 
i 二 2 1+ 和 


种 .类 似 地 ,“ 有 利于 事件 发 生 , 且 先 发 现 乙 盒 为 空 ”的 抽 法 ,也 有 a 
种 , 故 总 数 为 2a ,概率 为 
Fo /7227+1 一 2 人 -1+ /2 (2.9) 


两 种 方法 算出 的 结果 ,只 能 有 一 个 . 故 比 较 (2.8) 和 (2.9) ,我 
们 得 到 一 个 组 合 恒等式 
2 = [” 一 ”| 


r=0 r 7 
当然 ,你 也 可 以 怀疑 ,这 两 个 解法 中 有 一 个 不 对 ,因而 上 式 也 可 能 
销 了 .但 此 式 可 另行 证 明 . 为 方便 计 , 将 式 中 的 天 改 为 n 到 1] 


将 该 式 与 为 
"fn-ltry /ntm\Y /nt+m 
3, 
而 因 式 多 用 数学 归纳 法 证 明 : 当 m=0,1 时 ,直接 计算 可 知 其 成 
* 16 * 


2” 种 . 因此,“ 有 


立 , 然 后 用 易 证 之 等 式 
" 十 773 


2 


+ ("= | 
1 十] = | 7 十 1] 
”去 完成 归纳 证 明 . 


这 个 例子 给 人 的 启发 是 :适当 的 考虑 得 出 的 简洁 解法 .第 二 种 
解法 ,把 试验 做 到 必然 能 见 分 晓 的 地 步 ,较为 自然 易 懂 , 但 结果 则 
繁复 :要 不 是 有 (2.8) 对 照 ,我 们 可 能 停留 在 (2.9) ,而 得 出 不 理想 
的 形式 .前 一 解法 抓 住 了 这 一 点 :要 使 所 设 事 件 发 生 ,抽取 必然 是 
27 十 1 一 7 次 .这 一 简单 的 观察 导致 了 远 为 简洁 的 解 (2.8). 

例 2.5 有 21 本 不 同 的 书 , 随 机 地 分 给 17 个 人 . 问 “ 有 6 人 
得 0 本 ,5 人 得 1 本 ,2 人 得 2 本 ,4 人 得 3 本 ”这 个 事件 下 的 概率 
是 多 少 ? 

因为 每 本 书 都 有 17 种 可 能 的 分 法 , 故 总 的 不 同 分 法 ,有 1731 
种 .为 计算 有 利于 事件 下 的 分 法 ,得 分 两 步 分 析 :@ 按 得 书本 数 不 
同 把 17 人 分 成 4 堆 , 各 堆 分 别 含 6(0 本 )、5(1 本 )、2(2 本 )、4(3 
本 ) 人 .这 不 同 的 分 法 按 公 式 (2.6), 有 17! /(61 5!1 21 41) 种 .@ 
把 21 本 书 按 17 人 得 书 数 情况 分 为 17 堆 ,各 堆 数 目 依 次 为 

0,0,0,0,0,0,1,1,1,1,1,2,2,3,3,3,3 
不 同 分 法 有 
211/(01°1121°314) = 21!1/(217314) 
二 者 相 乘 ,得 出 有 利于 事件 瓦 的 分 法 总 数 , 进 而 得 出 五 的 概率 为 
17! 211/(17*12133144! 5!1 61) 

以 上 举 的 例子 都 有 一 定 的 代表 性 .古典 概率 计算 实质 上 就 是 
排列 组 合计 算 .但 在 分 析 问 题 时 ,怎样 去 选 定 一 个 适当 的 实现 随机 
化 的 机 制 ( 如 例 2.4, 例 2.5) ,怎样 去 正确 计算 公式 (1.1) 中 的 M ， 
N ,以 保证 既 不 重 算 也 不 漏 算 , 则 需要 细心 .尤其 是 :你 所 设想 的 机 
制 是 否 真 的 实现 了 等 可 能 性 ? 有 时 表面 上 看 想当然 对 ,其 实 是 似 
是 而 非 的 .如 例 2.3 中 ,圆圈 的 情况 和 直线 有 所 不 同一 一 在 直线 上 
正确 地 体现 了 等 可 能 的 做 法 ,在 圆圈 上 却 没有 .再 看 下 例 . 

例 2.6 nn 本 书 随机 给 分 甲乙 二 人 , 问 “ 甲 乙 各 至 少 得 到 1 

.17. 


本 “这 事件 天 的 概率 是 多 少 ? 

2 本 书 随机 地 分 给 2 人 , 甲 得 的 本 数 无 非 是 0,1,…,n ,一 共 
有 n++1 种 可 能 性 ,其 中 0 入 两 种 是 “全 归 一 人 ,和 刹 下 n 一 1 种 
有 利于 忆 , 故 P(E)=(n 一 1)/A(n+1). 

这 个 解法 是 否 对 ?不 对 .问题 在 于 :0,1,…,n 这 2+1 种 结果 
不 具有 等 可 能 性 . 攒 章 识 可 以 推 想 : 奋 n 较 大 , 则 甲 得 n /2 本 左右 
的 机 会 ,应 比 他 全 得 或 全 不 得 的 机 会 大 一 些 .正确 的 解法 如 下 :7 
本 书 分 给 2 人 ,不 同 的 分 法 有 2? 种 .其 中 仅 有 两 种 是 使 事件 瓦 不 
发 生 的 , 故 P(E) 应 为 (2* 一 2)/2*=1 一 1/2"71. 


1.3 事件 的 运算 、 条 件 概率 与 独立 性 


在 实用 上 和 理论 上 ,下 述 情况 常见 :问题 中 有 许多 比较 简单 的 
事件 ,其 概率 易于 算出 或 是 有 了 理论 上 的 假定 值 ,或 是 根据 以 往 的 
经 验 已 对 其 值 作 了 充分 精确 的 估计 .而 我 们 感 兴趣 的 是 一 个 复杂 
的 事件 , 它 通 过 种 种 关系 与 上 述 简 单 事件 联系 起 来 . 这 时 我 们 
想 设 法 利用 这 种 联系 ,以 便利 用 这 些 简单 事件 的 概率 去 算出 EE 的 
概率 .正如 在 微 积分 中 , 直接 利用 定义 可 算出 若干 简单 函数 的 导 
数 ,但 利用 导数 所 满足 的 法 则 ,可 据 此 算出 很 复杂 的 函数 的 导数 . 

例如 , 问 一 架 飞 机 射击 ,事件 下 是 “击落 这 架 飞 机 ”. 设 这 架 飞 
机 有 一 名 驾驶 员 ,两 个 发 动机 G1 和 Gs. 又 假定 当 击 中 驾驶 员 ,或 
同时 击 中 两 个 发 动机 时 ,飞机 才 被 击落 ,记事 件 

Eo = 击 中 驾驶 员 , 已 = 击 中 G;,i = 1,2 
则 EE 与 Eo,E1,E; 有 关 , 确 切 地 说 ,FE 即 由 Eo,F1,E; 决定 .其 关 
系 可 通过 文字 表达 如 下 : 
E = {Eo 发 生 或 者 开 1, 开 ;都 发 生 | 
这 种 表述 很 累 赣 ,我 们 希望 通过 一 些 符 号 来 表达 ,这 就 是 本 节 要 讨 
论 的 事件 的 关系 和 运算 .对 事件 进行 运算 ,如 同 对 数字 作 运 算 一 
样 :对 数字 进行 运算 得 出 新 的 数 , 而 对 事件 作 运 算 则 得 出 新 的 事 
件 . 
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1.3.1 事件 的 蕴含 .包含 及 相等 


在 同一 试验 下 的 两 事件 A 和 B, 如 果 当 A 发 生 时 B 必 发 生 ， 
则 称 A 蕴含 B, 或 者 说 B 包含 A, 记 为 ACB. 戎 A,B 互相 蕴含 ， 
即 ACB 有 日 BCA, 则 称 A,B 两 事件 相等 , 记 为 A=B. 

例如 , 搓 两 粒 仍 子 . 记 

A =}| 掷 出 的 点 数 之 和 大 于 101 
B = | 至 少 有 一 粒 骨 子 掷 出 61 
熙 事件 A 发 生 , 易 见 B 非 发 生 不 可 , 故 4A 列 含 已 . 一 个 形象 的 看 
法 如 图 1.3. 问 一 个 方形 靶 面 射击 ,以 
A,B 分 别 记 “ 命 中 图 中 所 标 出 的 闭 曲 线 
内 部 ”的 事件 , 则 命中 A 自 意味 着 命中 
B. 这 个 图 形 也 说 明了 “B 包含 4A ”这 个 
说 法 的 来 由 . 因 从 图 中 明白 看 出 ,B 这 
一 块 包含 了 A 这 一 块 . 

拿 "事件 是 试验 的 一 些 结果 ”( 见 
1.1.2 段 ) 这 个 观点 去 看 ,如 果 A 绰 含 
B, 那 只 能 是 ; A 中 的 试验 结果 必 在 B 四 1.3 
中 , 即 B 这 个 集合 (作为 试验 结果 的 集 
合 ) 要 大 一 些 ,“ 包 含 ” 一 词 即 由 此 市 来 .实际 含义 是 ; 若 ACB( 也 
与 为 B 汪 A), 则 A 和 B 相 比 ,更 难 发 生 一 些 , 因 而 其 概率 就 必然 
小 于 或 至 多 等 于 B 的 概率 “两 事件 A,B 相等 "无 非 是 说 ,A,B 
由 完全 同一 的 一 些 试验 结果 构成 , 它 不 过 是 同一 件 事 表面 上 看 来 
不 同 的 两 个 说 法 而 已 . 

例如 , 掷 两 个 仍 子 ,以 A 记事 件 “ 两 山子 掷 出 点 数 奇偶 不 同 ”， 
B 记事 件 ` 掷 出 点 数 之 和 为 奇数 ”. 这 两 个 事件 ,说 法 不 同 , 其 实则 
一 .对 复杂 情况 则 不 必 如 此 一 目 了 然 .证 明 两 事件 A ,B 相等 的 一 
般 方 法 是 : 先 设 事件 A 发 生 , 由 此 推出 B 发 生 , 再 反 过 来 ,由 假定 
B 发 生 推出 4 发 生 .这 将 在 后 面 举例 说 明 . 
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1.3.2 事件 的 互 矿 和 对 立 


若 两 事件 A,B 不 能 在 同一 次 试验 中 都 发 生 ( 但 可 以 都 不 友 
生 ), 则 称 它们 是 互 斥 的 .如 果 一 些 事件 中 任意 两 个 都 互 斥 , 则 称 这 
些 事件 是 两 两 互 斥 的 ,或 向 称 互 太 的 . 

例如 ,考虑 投 所 一 个 散 子 这 个 试验 . 记 FE, 为 事件 掷 出 的 点 数 
为 i 的 倍数 ”,i = 二 2,3,4, 则 EE; 与 FE4 为 互 斥 . 因 乔 Es 发生, 则 只 
有 掷 出 4 点 ,而 它 非 3 的 倍数 , 即 E3 必 不 发 生 .但 是 ,Es 和 3 并 
非 互 斥 . 因 若 掷 出 6 点 , 则 二 者 同时 发 生 . 傈 言 之 , 互 斥 事件 即 不 两 
立 之 事件 .从 “事件 是 由 一 些 试验 结 末 所 构成 的 "这 个 观点 看 , 互 压 
事件 无 非 是 说 :构成 这 两 个 事件 各 自 的 试验 结 采 中 不 能 有 公共 的 . 

互 斥 事件 的 一 个 重要 情况 是 “对 立 事件 ", 若 A 为 一 事件 , 则 
事件 


B = 1A 不 发 生 | 
称 为 A 的 对 立 事件 ,多 记 为 A( 读 作 Abar ,也 记 为 A'). 
例如 ,投掷 一 个 仍 子 ,事件 A= ! 元 出 奇数 点 | = {11,3,51 的 对 
立 事件 是 吾 =!{ 掷 出 偶数 点 | = 12,4,61. 对立 事件 也 常 称 为 “ 补 事 
件 ”. 拿 上 例 来 说 ,事件 A 包含 了 三 个 试验 结果 :1,3 和 5, 而 对 立 
事件 B 中 所 含 的 三 个 试验 结果 2,4 和 6, 正 好 补足 了 前 面 三 个 ,以 
得 到 全 部 试验 结果 . 


1.3.3 事件 的 和 (或 称 并 ) 


设 有 两 事件 A,B, 定 义 一 个 新 事件 C 如 下 : 
C = {A 发 生 , 或 B 发生) = {A,B 至 少 发 生 一 个 | 
所 谓 定义 一 个 事件 ,就 是 指出 它 何 时 发 生 , 何 时 不 发 生 . 现在 这 个 
事件 C 在 何 时 发 生 呢 ? 只 要 A 发 生 , 或 者 B 发 生 ( 或 二 者 同时 发 
生 也 可 以 ), 就 算是 C 发 生 了 ,不 然 ( 即 A,B 都 不 发 生 ) 则 算 作 C 
不 发 生 ,这 样 定义 的 事件 C 称 为 事件 A 与 事件 B 的 和 , 记 为 
C=A+B 
例如 , 搓 一 个 股 子 , 以 A 记事 件 1 掷 出 偶数 点 | = 12,4,61,B 
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记事 件 1 掷 出 3 的 倍数 | = 13,61, 则 C 
=A4+ 中 =12,3,4;,6|, 即 当 搓 出 的 点 为 
2,3,4 或 6 时 ,事件 C 发 生 , 而 掷 出 1,5 
时 则 不 发 生 . 我们 注意 到 ,两 事件 的 和 ， 
即 把 构成 各 事件 的 那些 试验 结果 并 在 
一 起 所 构成 的 事件 . 如 把 图 1.4 的 正方 
形 视 为 一 个 平面 靶 ,A,B 两 事件 分 别 表 
示 命 中 图 中 所 指 闭 曲线 内 部 , 则 C = 
A + 昌 表 示 “ 命 中 由 A,B 两 团 曲 线 的 外 图 1.4 
缘 所 围 成 的 区 域 ”. 这 区 域 比 A,B 都 
大 , 它 由 A ,B 两 部 分 合并 而 成 . 当然 ,作为 集合 ,重复 的 部 分 (图 
中 和 斜 线 标 出 的 部 分 ) 只 须 计 和 人 一 次 . 

这 样 , 阁 C=A+B, 则 A,B 都 蕴含 C,C 包含 A 也 包含 B. 
经 过 相 加 ,事件 变 “ 大 "了 (含有 更 多 的 试验 结果 ), 因 而 更 容易 发 生 
了 


事件 的 和 很 自然 地 推广 到 多 个 事件 的 情形 . 设 有 若干 个 事件 
41,4 ,4A, 它们 的 和 A ,定义 为 事件 
A = 1Al 发生, 或 A; 发生,…, 或 A, 发 生 | 
二 1Al,A;,…,A, 至 少 发 生 一 个 | 


且 记 为 A1+Asy+…+A, 或 》'A,( 也 常 记 为 UA; ,本 书 不 用 这 
二 工 一 


个 记号 ).A 是 由 把 41……A, 所 包含 的 全 部 试验 结果 并 在 一 起 所 
得 .和 的 定义 显然 地 推广 到 无 限 个 事件 的 情形 . 

在 此 要 不 大 其 烦 地 重复 一 点 .有 的 初学 者 对 事件 的 运算 感到 
不 易 理解 . 比如 ,定义 事件 A,B 之 和 为 C=|A,B 至 少 发 生 其 
一 | .他 们 问 :既然 已 说 A,B 至 少 要 发 生 一 个 , 那 岂 不 是 对 A,B 


* ”由 于 这 个 原因 ,事件 的 和 也 常 称 为 上 事件 的 并 ,和 A +B 也 常 被 记 为 AUB.“U” 
这 个 记号 有 “合并 ”的 含义 ,由 于 称呼 和 书写 上 的 方便 ,本 书 中 我 们 一 直 用 “和 ”与 “+” 
的 说 法 ,也 有 些 著作 在 当 A,B 互 斥 时 才 把 AUB 写成 A+B, 本 书 不 采用 这 个 做 法 . 
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作 了 限制 ? 不 然 , 我 们 不 要 忘记 1.1 节 中 所 说 的 “事件 不 是 指 已 发 
生 了 的 情况 ,而 是 某 种 情况 的 陈述 .定义 C 为 “A,B 至 少 发 生 其 
一 ”, 当然 不 是 说 A,B 已 经 或 必然 发 生 一 个 , 而 是 在 试验 时 ,大 
A,B 至 少 发 生 了 一 个 , 则 算 作 C 发 生 了 .在 任 一 次 特定 的 试验 
中 ,当然 可 能 A ,B 都 不 发 生 , 这 时 C 也 就 不 发 生 . 理解 了 这 一 点 
就 好 办 , 望 读者 多 加 留意 . 


1.3.4 概率 的 加 法 定理 


定理 3.1 右 干 个 互 斥 事件 之 和 的 概率 ,等 于 各 事件 的 概率 

之 和 : 
P(AI+A+…)=P(AI)+P(A，)+… (3.1) 

事件 个 数 可 以 是 有 限 的 或 无 限 的 ,这 定理 就 称 为 (概率 的 ) 加 法 定 
理 , 其 重要 条 件 是 各 事件 必须 为 两 两 互 斥 . 

在 概率 的 古典 定义 和 统计 定义 之 下 ,(3.1) 很 容易 证 明 . 拿 古 
典 定 义 来 说 , 设 试验 一 共有 N 个 等 可 能 的 结果 ,而 有 利于 事件 
A1i,A;,… 发 生 的 结果 数 分 别 为 MI,M,,…, 则 由 于 互 斥 性 ,有 利 
于 事件 A= Al+ As+… 发 生 的 结果 数 ,应 为 M = MI+ NM 十 …. 
于 是 

P(A)=(Mi+ My+ti)/N = MIAN + Mo/AN +… 

=P(AI)+ P(A,) +…- 

对 统计 定义 也 完全 类 似 地 处 理 . 

在 概率 论 书籍 中 ,加 法 定理 往往 被 称 为 加 法 公理 , 即 (3.1) 是 
不 加 证 明 而 被 接受 的 事实 . 这 条 公理 就 是 我 们 在 1.1.5 段 中 提 到 
而 未 加 说 明 的 , 柯 氏 公理 体系 中 的 第 3 条 . 

读者 可 能 会 问 :既然 在 古典 定义 .统计 定义 这 样 在 实用 上 重要 
的 概率 定义 之 下 ,(3.1) 是 可 以 证 明 的 ,那么 为 什么 要 把 它 看 作 一 
条 公理 ? 问题 在 于 :你 可 以 想像 而 且 也 确实 可 以 建立 一 种 概率 理 
论 , 其 中 (3.1) 不 成 立 . 柯 氏 公理 的 意思 是 说 :我 只 考虑 那 种 满足 
(3.1) 的 概率 理论 ,而 不 及 其 他 .正如 在 几何 学 中 ,你 可 以 把 “过 不 
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在 直线 / 上 的 任 一 点 只 有 一 条 与 /平行 的 直线 ”作为 公理 ,由 之 建 
立 一 套 欧 氏 几 何 学 ,也 可 以 废弃 这 条 公理 而 建立 非 欧 几何 学 ,二 
都 符合 形式 逻辑 .古典 和 统计 定义 之 适合 (3.1) ,不 过 是 说 明了 : 它 
们 是 柯 氏 公理 体系 中 的 东西 . 

加 法 定理 (3.1) 的 一 个 重要 推论 如 下 : 

系 3.1 以 A 表 A 的 对 立 事件 , 则 

P(A)=1- P(A) (3.2) 

证 明 很 容易 .以 2 记 必 然 事 件 , 则 按 对 立 事件 的 定义 有 A+ 
A=0 且 A 和 A 互 斥 . 因 P(Q)=1. 用 (3.1) 得 1=P(0)=P(A 
+A)= P(A)+ P(A), 即 (3.2). 

这 个 简单 公式 在 概率 计算 上 有 用 .因为 ,有 时 计算 P(A ) 不 
易 ,而 P(A ) 则 易 处 理 些 . 


1.3.5 事件 的 积 (或 称 交 )、 事 件 的 差 


设 有 两 事件 A ,B, 则 如 下 定义 的 事件 C 
C= {A,B 都 发 生 | 

称 为 两 事件 A,B 之 积 或 乘积 ,并 记 为 AB. 拿 图 1.4 的 例子 来 说 ， 
看 分 别 以 A ,B 表示 “命中 图 中 相应 区 域 " 的 事件 , 则 4B 就 是 事 
件 “ 命 中 图 中 和 斜 线 部 分 ”. 又 如 盟 子 试验 ,分 别 以 4A,B 记 ” 掷 出 偶 
数 点 和 ”“ 掷 出 素数 点 "之 事件 , 则 AB 就 是 事件 “ 掷 出 2 点 ”. 一般， 
事件 A,B 各 是 一 些 试验 结果 的 集合 ,而 AB 则 由 同属 于 这 两 个 
集合 的 那些 试验 结果 组 成 , 即 这 两 个 集合 的 交叉 “ 按 积 的 定义 ,两 
个 事件 4 ,已 互 斥 , 等 于 说 AB 是 不 可 能 事件 . 

多 个 事件 Ai,A>,… (有限 或 无 限 个 都 可 以 ) 的 积 的 定义 类 


似 : A = 1414… 都 发 生 }, 记 为 4 = Ai4… 或 [4 (事件 
i=1 
个 数 有 限 ) 或 【| A; (事件 个 数 无 限 ). 
:二 1 
* 出 于 这 个 原因 ,事件 的 积 也 常 称 为 事件 的 交 , 积 AB 也 常 记 为 ANB.“ 站 "这 个 


记号 有 取 交 的 含义 .为 书写 方便 ,本 书 一 直 用 AB 这 个 记号 . 
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两 个 事件 A,B 之 差 , 记 为 A 一 B, 定 义 为 
“A-B= 1|A 发生,B 不 发 生 | 

例如 , 则 才 提 到 的 撕 角 子 试验 中 的 两 个 事件 A 和 B,A 一 B= 1:4， 
6| .在 图 1.4 中 ,A 一 B 就 是 “命中 图 中 用 点 标 出 的 区 域 ” 这 个 事 
件 .一 般 地 ,A 一 B 就 是 从 构成 A 的 那些 试验 结果 中 ,去掉 在 B 内 
的 那 一 些 .很 明显 

A-B=AB (3.3) 
其 中 B 是 B 的 对 立 事件 .因为 ,A B 无 非 是 说 ,A ,B 都 发 生 , 即 A 
发 生 B 不 发 生 . 这 样 , 差 可 以 通过 积 去 定义 . 

我 们 对 事件 引进 了 和 差 积 等 运算 ,借用 了 算术 中 的 名 词 . 但 应 
注意 ,算术 的 法 则 不 一 定 能 用 于 事件 运算 .有 些 规则 是 成 立 的 , 例 
如 ,和 有 A+B 及 积 AB 与 次 序 无 关 :A + B=B+A,AB=BA, 这 
由 定义 直接 看 出 .乘法 结合 律 也 成 立 :(AB)C= A(BC)( 它 们 都 
等 于 ABC). 分 配 律 也 对 ,例如 : 

A(B-C)= AB-AC (3.4) 
证 明 如 下 : 设 在 左边 的 事件 发 生 , 则 按 积 的 定义 ,事件 A 和 B-C 
都 发 生 . 按 差 的 定义 ,B 发 生 ,C 不 发 生 . 因此 , A ,B 同时 发 后 而 
A,C 不 同时 发 生 , 故 AB 发 生 而 AC 不 发 生 . 按 差 的 定义 , 即 知 
AB 一 AC 发 生 . 反 过 来 , 若 右边 的 事件 发 生 , 则 AB 发 生 而 AC 不 
发 生 . 由 前 者 知 A,B 都 发 生 , 由 A 发 生 及 AC 不 发 生 , 知 C 不 发 
生 , 故 BC 发 生 . 因 A 和 B-C 都 发 生 知 A(B - C) 发 生 , 这 证 
明了 (3.4). 

这 碌 是 我 们 在 本 节 1.3.1 段 未 尾 处 指出 的 证 明 事 件 相 等 的 一 
般 方法 之 一 实例 .读者 必须 了 解 , 像 (3.3) ,(3.4) 这 类 的 等 式 , 不 过 
是 反映 了 一 种 逻辑 关系 ,因而 必须 用 上 述 逻 辑 思维 的 方式 去 验证 . 
有 些 关 系 , 看 来 不 习惯 ,但 逻辑 上 很 简单 .例如 ,4A+A=A 而 非 
2A(2A 无 意义 ),AA = A 而 非 A?(A? 无 意义 ), 由 A 一 B= 儿 ( 不 
可 能 事件 ), 推 不 出 A=B, 而 只 能 推出 ACB. 又 如 ,(A 一 B)+B 
并 不 是 A 而 是 A + B( 请 读者 自 证 ), 等 等 . 
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1.3.6 条 件 概 率 


一 般 讲 ,条 件 概 率 就 是 在 附加 一 定 的 条 件 之 下 所 计算 的 概率 . 
从 广义 的 意义 上 说 ,任何 概率 都 是 条 件 概率 ,因为 ,我 们 是 在 一 定 
的 试验 之 下 去 考虑 事件 的 概率 的 ,而 试验 即 规定 有 条 件 . 在 概率 论 
中 ,规定 试验 的 那些 基础 条 件 被 看 作 是 已 定 不 变 的 . 如果 不 再 加 入 
其 他 条 件 或 假定 , 则 算出 的 概率 就 叫做 “无 条 件 概 率 ” ,就 是 通常 所 
说 的 概率 . 当 说 到 “条 件 概率 ”时 ,总 是 指 另 外 附加 的 条 件 , 其 形式 
可 妇 和 气 为 "已 知 某 事件 发 生 了 ?”. 
例如 ,考虑 毛 一 个 骨 子 的 实验 . 这 里 , 骨 子 必须 为 均匀 的 正 立 
方 体 , 抛 括 要 有 足够 的 高 度 等 要 求 , 是 这 试验 的 固有 规定 ,不 作为 
附加 条 件 .考虑 三 个 事件 :A: 掷 出 素数 点 ” ,再 :“ 掷 出 奇数 点 ”,C : 
“ 掷 出 偶数 点 ” ,有 
A= |{2,3,5},B = {1,3,5},C = {2,4,6| (3.5) 
于 是 算出 A 的 (无 条 件 ) 概 率 为 366=172. 现 若 附 加 上 “已 知已 发 
生 , 则 可 能 情况 只 有 三 种 :1,3,S$, 其 中 两 种 有 利于 A 发 生 , 故 在 
这 条 件 下 ,A 的 条 件 概率 , 记 为 P(A1B), 等 于 273. 同 样 ,在 给 定 
事件 C 发 生 的 条 件 下 ,A 的 条 件 概率 为 P(A1C)=1/3. 
让 我 们 在 古典 概率 的 模式 下 来 分 析 一 般 的 情况 . 设 一 试验 有 
NN 个 等 可 能 结果 ,事件 A ,B 分 别 包 含 其 Mi 和 M, 个 结果 ,它们 
有 Mi 个 是 公共 的 ,这 就 是 事件 AB 所 包含 的 试验 结果 数 . 若 已 给 
B 发 生 , 则 我 们 的 考虑 由 起 先 的 NN 个 可 能 结果 局 限 到 现在 的 M。， 
个 ,其 中 只 有 Mi 个 试验 结果 使 事件 A 发 生 , 故 一 个 合理 的 条 件 
概率 定义 ,应 把 P(A1B) 取 为 Mi .但 
Mis/M; = (M1 /N)/A Ms/N) = P(AB)/P(B) 
由 此 得 出 如 下 的 一 般 定义 : z 
定义 3.1 设 有 两 事件 A,B 而 P(B) 关 0. 则 “在 给 定 B 发生 
的 条 件 下 A 的 条 件 概 率 ”, 记 为 P(A1B), 定 义 为 
P(A|B) = P(AB)/P(B) (3.6) 
当 P(B)= 0 时,(3.6) 无 意义 .在 高 等 概率 论 中 ,也 要 考虑 
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P(AIB) 当 P(B)=0 时 的 定义 问题 , 那 要 牵涉 到 高 次 的 数学 , 超 
出 本 书 范 围 之 外 .在 后 面 我 们 也 会 和 个 别 这 种 情况 打交道 , 那 可 以 
用 极限 的 方法 去 处 理 . 

(3.6) 是 条 件 概 率 的 一 般 和 定义, 但 在 计算 条 件 概率 时 ,并 不 一 
定 要 有 它 . 有 时 ,直接 从 加 入 条 件 后 改变 了 的 情况 去 算 , 更 为 方便 . 
举 一 个 例子 . 

例 3.1 据 三 个 均匀 骨 子 .已 知 第 一 粒 找 子 挪 出 么 点 (事件 
8). 问 : 掷 出 点 数 之 和 不 小 于 10 这 个 事件 A 的 条 件 概率 是 多 


少 ? 


既然 第 一 粒 货 子 已 坐 定 了 1, 则 在 这 一 条 件 下 ,为 使 事件 A 
发 生 , 第 二 ,三 粒 角 子 据 出 点 数 之 和 不 能 小 于 9. 这 一 情况 有 10 
种 , 即 36,63,45,54,46,64,55,56,65,66. 这 里 “36” 表 示 第 二 .三 
粒 货 子 分 别 掷 出 3 和 6, 余 类 推 ,这 样 , 得 出 P(A1B)=10/36=5/ 
18. 

此 题 若 直接 用 公式 (3.6) 计 算 , 则 比 上 述 解法 复杂 些 , 读 者 可 
一 试 以 证 明 结 果 一 致 . 


1.3.7 事件 的 独立 性 ,概率 乘法 定理 


设 有 两 事件 A ,B.A 的 无 条 件 概 率 P(A ) 与 其 在 给 定 B 发 生 
之 下 的 条 件 概率 P(A1B), 一 般 是 有 差异 的 .这 反映 了 这 两 事件 
之 间 存 在 着 一 些 关 联 . 例 如 ,车 P(A1B)>P(A), 则 B 的 发 生 使 
A 发 生 的 可 能 性 增 大 了 :B 促进 了 A 的 发 生 . 

有 反之 ,各 P(A)= P(A|1B), 则 B 的 发 生 与 否 对 A 发 生 的 可 
能 性 毫 无 影响 ”. 这 时 在 概率 论 上 就 称 A,B 两 事件 独立 ,而 由 
(3.6) 得 出 


* 这 样 说 应 补充 :由 P(4)= P(A1B) 推 出 P(4)= P(A1B),B 为 B 的 对 立 捉 件 . 
事实 上 ,由 P(A)= P(A1B) 及 (3.6) 知 P(AB)=P(A)P(B). 因 为 A=AB+ABH 
405,4B 互 斥 , 知 P(AB)= P(A)- P(AB)= P(A)- P(A)P(B)= P(A)(1- P(B)) 
=P(A)P(B). 故 P(A41B)=P(AB)/P(B)= P(A). 
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P(AB) = P(A)P(B) (3.7) 

拿 此 式 来 刻画 独立 性 , 比 用 P(A)= P(A1B) 更 好 , 因 (3.7) 不 受 
P(B) 是 否 为 0 的 制约 ( 当 P(B) 为 0 时 (3.7) 必 成 立 ). 因此 ,我 们 
取 如 下 的 定义 : 

定义 3.2 两 事件 A,B 若 满 足 (3.7), 则 称 A ,B 独立 . 

定理 3.2 两 独立 事件 A,B 的 积 AB 之 概率 P(AB) 等 于 其 
各 自 概率 之 积 P(A )P(B). 

这 个 定理 就 是 (3.7) 式 , 它 称 为 “概率 的 乘法 定理 ”. 其 实 , 它 就 
是 独立 性 的 定义 ,我 们 之 所 以 又 将 它 重复 列 出 并 标 为 一 个 定理 ,就 
是 因为 这 个 事实 极其 重要 . 

在 实际 问题 中 ,我 们 并 不 常用 (3.7) 式 去 判断 两 事件 A,B 是 
否 独 立 , 而 是 相反 :从 事件 的 实际 角度 去 分 析 判 断 其 不 应 有 关联 因 
而 是 独立 的 ,然后 就 可 以 用 (3.7). 例 如 ,两 个 工人 分 别 在 两 台 机 床 
上 进行 生产 ,彼此 各 不 相干 , 则 各 自 是 否 生 产 出 废品 或 多 少 废品 这 
类 事件 应 是 独立 的 .一 城市 中 两 个 相距 较 远 的 地 段 是 否 出 交通 事 
故 ,一 个 人 的 收入 与 其 姓氏 笔划 ,这 类 事 凭 常识 推 想 ,认定 为 独立 
的 . z z 

由 此 可 知 ,两 事件 有 独立 性 多 半 是 在 下 述 情况 之 下 产生 的 .有 
两 个 试验 EEF! 和 五? ,其 试验 结果 (各 有 许多 ) 分 别 记 之 以 cl 和 e，. 
考虑 一 个 “大 试验 瓦 , 它 由 天 ,天 两 部 分 构成 ( 故 下 常 称 为 复合 
试验 ), 可 记 为 匹 =( 厂 , 忆 )) ,其 结果 可 记 为 (el,e>). 在 试验 瓦 的 
一 个 事件 , 即 是 牵涉 到 (ej ,e,) 的 某 一 个 陈述 ( 见 1.1.2). 如果 A，， 
As 是 两 个 事件 ,41 只 牵涉 el 而 4， 只 牵涉 e,, 则 当 两 试验 结果 
如 果 彼 此 不 影响 时 , Al,A, 会 有 独立 性 .可 以 举 -- 个 具体 例子 , 设 
试验 Fi 为 掷 一 个 均匀 仍 子 ,其 试验 结果 el 有 6 个 :1,2,…,6. 试 
验 EE; 为 掷 一 个 硬币 ,其 结果 e; 有 两 个 :“ 正 和"* 反 ”. 定义 两 事件 
Ai,A2>: 

Ai = }{ 掷 出 1 点 所 4 = | 掷 出 正面 | 
这 两 个 事件 可 看 成 同一 试验 巨 下 的 两 个 事件 ,E = {Ei,EE,1 , 它 包 
含 12 个 可 能 结果 ， 
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(1, 正 ),(1, 反 ),(2, 正 ),(2, 反 ),…,(6, 正 ),(6, 反 ) 

事件 A1 包含 两 个 可 能 结果 , 即 |(1, 正 ),(1, 反 ) ,而 A， 则 包含 6 
个 可 能 结果 :1{(1, 正 ),(2, 正 ),…,(6, 正 )|. 通 过 这 种 方式 ,我 们 把 
两 个 看 来 不 相干 的 事件 A| 和 A, 统一 在 一 个 试验 玉 之 下 ,而 其 
独立 性 就 好 理解 了 一 一 即 撕 艇 子 和 和 撕 人 硬币 彼此 不 影响 而 已 .这 种 
把 若干 个 不 相干 的 试验 统一 起 来 的 做 法 ,看 起 来 好 像 纯粹 是 一 种 
形式 ,但 在 理论 上 有 其 方便 . 

如 果 试 验 的 内 容 真 是 单一 的 ,那么 ,在 这 种 试验 下 两 事件 独立 
是 较 少 出 现 的 例外 .因为 ,两 个 事件 既然 都 依赖 同 -- 批 结果 ,彼此 
谅 必 会 有 影响 . 撕 两 个 均匀 性子 ,以 A; 记 ” 点 数 和 为 ;的 倍数 ”， 
i 二 2,3,5. 通 过 用 (3.7) 验 证 可 知 ,A, 与 A3 独立 ,但 这 非 一 般 性 
质 ,比如 , A, 与 A; 就 不 独立 ,对 这 种 “单一 ”性 试验 ,(3.7) 作 为 验 
证 独立 性 的 工具 ,还 是 有 用 的 .有 时 ,未 经 周到 考虑 的 直观 也 可 能 
引 和 人 歧途 . 

例 3.2 再 考虑 例 3.1, 记 B= {至 少 有 一 个 骨 子 毛 出 11} ,而 
把 事件 A 定义 为 A = {三 个 角 子 挪 出 的 点 数 中 至 少 有 两 个 一 样 
《 即 不 全 相 异 )} , 问 A,B 是 否 独 立 ? 

初 一 看 使 人 的 倾向 于 相信 A,B 独立 ,理由 如 下 ;知道 BB 发 
生 , 即 知道 掷 出 的 点 中 有 1, 对 A 而 言 , 似 与 知道 掷 出 的 点 中 有 2 
(或 3,4,5,6 都 可 以 ) 一 样 . 故 1 这 个 数 并 不 相对 地 更 有 利于 或 更 
不 利于 A 发 生 . 经 过 计算 发 现 不 然 :4,B 并 不 独立 .这 一 点 看 来 
有 些 难 理解 ,但 是 ,如 按 下 述 分 析 , 则 可 以 信服 :考虑 B. 若 BB 发 
生 , 则 三 个 蜗 子 都 不 出 么 .这 样 ,它们 都 只 有 5 种 可 能 性 (2,3,4,5， 
6), 比 不 知 B 发 生 时 可 能 取 的 点 数 1,2,3,4,5,6 少 了 一 个 ,在 5 个 
数 中 拿 3 个 (每 个 可 重复 拿 ) ,其 有 两 个 一 样 的 可 能 性 , 自 应 比 在 6 
个 数 中 拿 3 个 时 ,有 两 个 一 样 的 可 能 性 要 大 些 .这 个 分 析 指 出 应 有 
P(A)<P(A1B), 由 此 推出 P(A)>P(A1B)( 见 习题 15),A,B 
不 独立 . 

多 个 事件 独立 性 的 定义 ,就 是 两 个 事件 情况 的 直接 推广 . 

定义 3.3 设 Ai,A,,… 为 有 限 或 无 限 个 事件 .如 果 从 其 中 任 
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意 取出 有 限 个 AAAi 都 成 立 . . 
P(A; AL Ai ) 一 P(A; )P(A; )*P(A; ) (3.8) 


则 称 事件 A1,A;,… 相 互 独立 或 简称 独立 . 
这 个 定义 与 由 条 件 概率 出 发 的 定义 是 等 价 的 ,后 者 是 说 :对 任 
何 互 不 相同 的 1,i3,… ,i, ,有 
P(A; IAA ) = P(A;) (3.9) 
即 任意 事件 A; 发 生 的 可 能 性 大 小 ,不 受 其 他 事件 发 生 的 影响 .这 
更 接近 于 独立 性 的 原 义 .但 是 ,(3.9) 的 左边 依赖 于 P(A;…A; ) 
>0, 否 则 无 意义 ,而 (3.8) 就 没有 这 个 问题 .另外 ,定理 3.2 后 面 说 
的 那 段 话 当 然 也 适用 于 多 个 事件 的 情形 :多 个 事件 的 独立 性 往往 
产生 于 由 多 个 试验 构成 的 复合 试验 中 ,每 个 事件 只 与 其 中 一 个 试 
验 有 关 . 
由 独立 性 定义 立即 得 出 下 面 的 概率 乘法 定理 : 
定理 3.3 若 于 个 独立 事件 A1,…,A, 之 积 的 概率 ,等 于 各 
事件 概率 的 乘积 : 
P(A1…A,) = P(A1)…P(A,) (3.10) 
来 法 定理 的 作用 与 加 法 定理 一 样 :把 复杂 事件 的 概率 的 计算 
归结 为 更 简单 的 事件 概率 的 计算 ,这 当然 要 有 条 件 : 相 加 是 互 斥 ， 
相 乘 是 独立 . 
由 独立 性 定义 可 得 到 下 面 两 条 重要 推论 ， 
系 3.2 独立 事件 的 任 一 部 分 也 独立 .例如 ,A,B,C,D 四 事 
件 相互 独立 , 则 A,C, 或 A,B,D 等 ,都 是 独立 的 . 

”这 一 点 由 独立 性 定义 直接 推出 .更 进一步 可 推广 为 ;由 独立 事 
件 决定 的 事件 也 独立 .举例 来 说 , 若 事件 Al,…, A6 相互 独立 , 则 
以 下 三 事件 

Bi= A+A;s,B» = A;3~ As,A;3 = AsA。 (3.11) 
也 独立 .这 在 直观 上 很 显然 ,但 证 明 起 来 很 麻烦 ,因为 可 以 产生 的 
事件 很 多 .在 下 一 章 中 我 们 将 指出 另外 的 考虑 方法 ( 见 第 二 章 例 
3.7). 
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如 果 把 B; 改 为 4A4AJA5, 则 B，,B3 ,就 不 一 定 独 立 了 .理由 
也 很 明显 :二 者 都 与 A4 有 关 , 因 而 彼此 也 就 有 了 关系 . 
系 3.3 车 一 列 事件 A1,A,,… 相 互 狐 立 , 则 将 其 中 任 一 部 分 
改 为 对 立 事 件 时 ,所 得 事件 列 仍 为 相互 独立 . 
例如 , 若 Ai,A,,A3 相互 独立 , 则 Ai ,A，,A3 ,或 Ai,A，，A3， 
或 A1,A,,A3 等 ,都 是 互相 独立 的 . 
这 一 点 从 直观 上 也 很 显然 , 且 对 两 个 事件 的 情况 ,已 在 27 页 
的 足 注 中 作 过 证 明 . 让 我 们 再 看 一 个 三 个 事件 的 例子 .比如 ,要 证 
Ai,As, A;3 独立 ,要 对 其 验证 (3.8), 其 中 有 P(AlAs A;3)= 
P(A1)P(A,)P(A;). 为 此 注意 
A; A; = AiA> A; + A1A, A 
且 右 边 两 事件 互 斥 , 故 
P(AIA, A3) = P(A, A;) - P(AIA，A3) 
=P(A2)P(A;) - P(A1A, A;) (3.12) 
再 利用 A1A,= A1A,A3+ Al1A, A;, 得 
P(A1A, A3) = P(A1A;) — P(A1A2A;) 
=P(A1)P(A;,) ~- P(A1)P(A,)P(A;) 
=P(A1)P(A)(1 - P(A;)) 
=P(A1)P(A,)P(A;) 
以 此 代入 (3.12), 得 
P(AiA; A;3) = P(A;)P(As) - P(AI)P(A,)P(A,) 
=(1 — P(A1))P(A,)P(A;) 
= P(A1)P(A,)P(A;) 
明 所 欲 证 .可 以 看 出 ; 当 涉 及 众多 的 事件 时 ,这 么 处 理会 很 元 长 ,但 
并 无 任何 实质 困难 (可 使 用 数学 归纳 法 ,对 所 含 对 立 事件 个 数 进行 
归纳 ). 
除了 相互 独立 之 外 ,还 有 了 所谓“ 两 两 独立 ”的 概念 . 一 些 事件 
Ai,A;,… ,如果 其 中 任意 两 个 都 独立 , 则 称 它们 两 两 独立 ,由 相互 
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独立 必 推 出 两 两 独立 , 反 过 来 不 一 定 对 .从 数学 上 ,这 无 非 是 说 :由 
(3.8) 对 yx =2 及 任何 韦 关 i 成 立 ,不必 能 推出 该 式 当 m >2 时 
也 成 立 .下 面 是 一 个 简单 的 例子 : 

例 3.3 有 四 个 大 小 质地 一 样 的 球 , 分 别 在 其 上 写 上 数字 1， 
2,3 和 “1,2,3”, 即 第 4 个 球 上 1,2,3 这 三 个 数字 都 有 .引进 三 个 
事件 : 

4; = | 随机 抽出 一 球 , 球 上 有 数字 i| ,i = 1,2,3 
所 谓 随机 抽出 一 球 , 即 每 球 被 抽出 的 概率 都 是 144. 易 见 P(Al)= 
P(A,)= P(A3)=1 旬 . 因 为 ,为 使 事件 A, 发 生 ,必须 抽出 第 一 球 
或 第 四 球 , 有 2 种 可 能 .又 P(A1As)= P(A1A;3)= P(A,A;) = 
1[4. 因 为 ,要 Al,A， 同 时 发 生 ( 抽 出 的 球 上 既 有 1 又 有 2) ,必须 
抽出 第 四 球 .这 样 ,对 任 一 对 事件 A;, A;, 都 有 1/4= P(A;A,)= 
P(A;)P(Aj), 而 A1,As,A; 为 两 两 独立 . 

但 A1,A;,A3 不 是 相互 独立 . 因为 , 易 见 P(AiA,A;) 也 是 
1[4, 而 P(A1)P(A,)P(A;) 为 1/8, 二 者 不 相等 . 

在 现实 生活 中 ,难于 想像 两 两 独立 而 不 相互 独立 的 情况 .可 以 
这 样 想 : 独 立 性 毕竟 是 一 个 数学 概念 ,是 现实 世界 中 通常 理解 的 那 
种 独立 性 的 一 种 数学 抽象 , 它 难 免 会 有 些 不 尽 人 意 的 地 方 . 

独立 性 的 概念 在 概率 论 中 极端 重要 . 较 早 期 (比方 说 ,到 上 世 
纪 30 年 代 止 ) 的 概率 论 发 展 中 , 它 占据 了 中 心地 位 .时 至 今日 ,有 
不 少 非 独立 的 理论 发 展 了 起 来 ,但 其 完善 的 程度 仍 不 够 . 而且, 独 
立 性 的 理论 和 方法 也 是 研究 非 独 立 模 型 的 基础 和 工具 .在 实用 上 ， 
确 有 许多 事件 其 相依 性 很 小 ,在 误差 容许 的 范围 内 ,它们 可 视 为 独 
立 的 ,而 方便 于 问题 的 解决 . 

利用 本 节 中 引进 的 事件 运算 ,独立 性 概念 ,加 法 乘法 定理 ,可 
计算 一 些 较 复杂 事件 的 概率 . 举 几 个 例子 ， 

例 3.4 考虑 本 节 开 始 处 提 到 的 那个 “ 打 飞 机 ”的 例子 . 按 所 
作 规 定 , “飞机 被 击落 "这 事件 玉 可 表 为 

EF = Eo+ EikE, 
设 Eo ,Fl,E, 三 事件 独立 .这 假定 从 实际 角度 看 还 算 合 理 . 记 Eo， 
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E1,EE; 的 概率 分 别 为 po, pi,p2. 为 算 上 的 概率 P(E), 不 能 直接 
用 加 法 定理 , 因 Eo 与 EiE, 并 非 互 斥 , 考 虑 EE, 易 见 EE = Eo ElE,. 
因 Eo,E1,Es 独立 , 按 系 3.2 后 面 指出 的 ,Eo 和 E1E; 独 立 , 故 
P(E) = P(E0o)P(ELE,) 
有 P(E0o)=1- P(Eo)=1- po, P(EIE;2)=1- P(EIE;)=1- 
P(EN)P(E;)=1- pip;. 代 和 信 上 式 得 P(E)= (1 po)(1- 
pi1p2) ,而 
P(E)=1— P(E)=1- (1- p0)(1- pi1p;) 
= pot pip2 ~ Popip?2 

例 3.5 甲乙 二 人 下 象棋 ,每 局 甲 胜 的 概率 为 ec, 乙 胜 的 概 
率 为 5, 为 简化 问题 , 设 没有 和 局 的 情况 ,这 意味 着 a + 0 = 1. 

设想 甲 的 棋艺 高 于 乙 , 即 a >>65. 考 虑 到 这 一 点 ,他们 商定 最 终 
胜 负 的 规则 如 下 :到 什么 时 候 为 止 甲 连 胜 了 三 局 而 在 此 之 前 乙 从 
未 连 胜 二 局 , 则 甲 胜 . 反 之 , 若 到 什么 时 候 为 止 乙 连 胜 了 二 局 而 在 
此 之 前 甲 从 未 连 胜 三 局 , 则 乙 胜 . 现 要 求 “ 甲 最 终 取 胜 ” 这 事件 A 
的 概率 P(A), 及 “ 乙 最 终 取胜 ”这 事件 B 的 概率 P(B). 

为 方便 计 , 分 别 以 上 和 下 表 甲 、 乙 在 特定 的 一 局 取胜 的 事件 ， 
有 PE)=a,P(F)=0, 现 考虑 "四 取胜 "的 事件 A ,分 两 种 情况 . 

1. 第 一 局 甲 胜 而 最 终 甲 胜 了 . 

一 情况 又 可 分 解 为 许多 子 情况 :对 n =0,1,2…, 甲 经 过 
个 “阶段 "后 才 取 胜 ,每 个 阶段 是 EF 或 EEF ,然后 接着 来 一 个 
EEE .例如 , 甲 经 过 4 个 阶段 后 获胜 的 一 种 可 能 实战 结果 为 
EEF EF EEF EEE 

即 共 下 了 11 局 甲 才 获胜 ， 其 中 第 1,2,4,6,7,9,10,11 局 甲 胜 ,其 
余 乙 胜 . 

每 个 阶段 不 是 EF 就 是 EEF ,这 两 种 情况 互 斥 , 又 由 独立 性 ， 
知 每 个 阶段 概率 为 ca + aab = 二 ab(1+a). 再 由 独立 性 , 知 “ 经 nn 阶 
段 后 甲 获 胜 ” 的 概率 ,为 [ab(1+a)j"a3,n 可 以 为 0,1,2,…, 不 同 
的 ?2 互 斥 .于 是 这 部 分 概率 总 和 为 
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pb = 23SY[ab(l t+a)l”=a /lab(l+a))| 


2. 第 一 局 乙 胜 而 最 终 甲 胜 了 . 
既然 第 一 局 为 下 而 最 终 甲 胜 , 第 二 局 必须 是 歼 , 故 从 第 二 局 
作 起 点 看 .我 们 回 到 了 情况 1, 从 而 这 部 分 的 概率 为 bp (请 读者 注 
意 ,这 里 事实 上 已 用 了 概率 的 乘法 定理 :P( 第 一 局 乙 胜 且 最 终 甲 
胜 )= P( 第 一 局 乙 胜 )P( 第 二 局 甲 胜 旦 最 终 甲 胜 ) ,第 一 项 为 5 而 
后 一 项 为 p. 总 合 两 个 情况 (它们 互 斥 ), 用 加 法 定理 ,得 
P(A)= a(l+6)/A1- ab(l+a)l] (3.13) 
直观 上 我 们 觉得 ,这 个 竞赛 无 限期 拖 下 去 分 不 出 胜 负 是 不 可 
能 的 ,这 意味 着 P(B)=1- P(A). 可 是 ,上 述 直 观看 法 仍 须 证 明 ， 
不 如 直接 算 . 方 法 与 算 P(A) 一 样 ,但 须 分 三 种 情况 ;第 一 局 乙 
胜 . 避 第 一 局 甲 胜 ,第 二 局 乙 胜 . @ 前 两 局 甲 胜 ,我 们 把 具体 计算 留 
给 读者 (习题 16). 结果 为 
P(B)= (1+a+ta)o /Al -ab(l+a)] (3.14) 
由 于 a +65 二 1, 极 易 验证 P(A)+P(B)=1. 
这 个 例子 值得 细心 品味 .第 一 , 它 提 供 了 一 个 涉及 到 无 限 个 事 
件 的 情况 (在 甲 最 终 取胜 前 可 以 经 过 任意 多 的 “阶段 ”) ,以 及 在 无 
穷 个 事件 时 使 用 加 法 定理 (3.1). 第 二 ,本 例 告诉 我 们 ,在 面 对 一 个 
复杂 事件 时 , 主要 的 方法 是 冷静 地 分 析 以 设法 把 它 分 拆 成 一 些 互 
斥 的 简单 情况 . 这 里 ,必须 细心 确保 互 斥 性 又 无 遗漏 ,一 着 不 慎 , 满 
盘 皆 非 . 
例 3.6 设 一 个 居民 区 有 2 个 人 , 设 有 一 个 邮局 , 开 c 个 窗 
日 , 设 每 个 窗口 都 办 理 所 有 业务 .c 太 小 ,经 常 排 长 队 ;c 太 大 又 不 
经 济 . 
现 设 在 每 一 指定 时 刻 , 这 2 个 人 中 每 一 个 是 否 在 邮局 是 独立 
的 ,每 人 在 邮局 的 概率 都 是 p .设计 要 求 :“ 在 每 一 时 刻 每 窗口 排队 
人 数 ( 包 括 正 在 被 服务 的 那个 人 ) 不 超过 mm." 这 个 事件 的 概率 ,要 
不 小 于 a (例如 ,a=0.80,0.90 或 0.95). 问 至 少 须 设 多 少 和 窗口 ? 
把 nn 个 人 编号 为 1,… ,nn, 记 事件 
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E,= | 在 指定 时 刻 第 i 个 人 在 邮局 办 事 1 ,i 二 1,…,n 则 在 指 
定时 刻 , 邮 局 的 具体 情况 可 以 用 形 如 
E! EsEsaEasEs Eo ErEg* Ei E, 1 E, (3.15) 
这 种 事件 去 描述 之 . 为 了 每 个 窗口 排队 人 数 都 不 超过 m ,在 上 述 
序列 中 ,不 加 “bar 的 五 的 个 数 ,至 多 只 能 是 cm . 现 固 定 一 个 有 
cm ,来 求 “ 在 (3.15) 中 恰 有 上 个 不 加 bar 的 EE ”这 事件 Bi 的 概率 . 
由 独立 性 以 及 P(E,)=p,P(E;)=1 一 p, 知 每 个 像 (3.15) 那 样 的 
序列 且 不 加 bar 的 瓦 恰 有 太 个 时 ,概率 为 共 (1 一 六) .但 有 个 不 
加 bar 的 位 置 ,可 以 是 7 个 位 置 中 的 任何 玉 个 .因此 ,一 共有 


[7 个 形 如 (3.15) 的 序列 ,其 中 不 加 bar 的 玉 恰 有 上 个, 这样 得 


到 P(B,) = jx -pp)". 由 于 可 以 为 0,1,…,cm, 且 不 同 
的 & 对 应 的 Bi 互 斥 , 故 得 


Cm 


P( 每 个 窗口 排队 人 数 不 超 过 m) = 》， We ms 


(3.16) 
找 一 个 最 小 的 自然 数 c ,使 上 式 不 小 于 指定 的 a ,就 是 问题 的 答 
案 . 
这 是 一 个 有 现实 意义 的 例题 .在 n 较 大 时 ,可 用 更 方便 的 近 
似 方法 确定 c ,参见 第 三 章 例 4.1. 当然, 实际 问题 比 本 例 描述 的 要 
复杂 得 多 ,因为 有 一 个 每 人 服务 时 间 长 短 的 问题 .这 时 间 长 短 并 非 
固定 而 是 随机 的 .这 类 问题 属于 排队 论 ,是 运筹 学 的 一 个 分 支 .本 
例 是 运筹 学 与 概率 论 有 联系 的 一 个 例子 . 


1.3.8 全 概率 公式 与 贝 叶 斯 公式 


全 概率 公式 
设 Bi,B2 为 有 限 或 无 限 个 事件 ,它们 两 两 互 斥 且 在 每 次 
试验 中 至 少 发 生 一 个 ,用 式 表 之 , 即 
BB; = 好 (不 可 能 事件 ) , 当 守 天 1 
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Bi + B, +… = 0( 必 然 事件 ) 
有 时 把 具有 这 些 性 质 的 一 组 事件 称 为 一 个 “完备 事件 群 ,注意 , 任 
一 事件 B 及 其 对 立 事件 组 成 一 个 完备 事件 群 . 

现 考虑 任 一 事件 A. 因 0 为 必然 事件 ,有 A = AQ = AB'1 + 
AB;,+…. 因 Bi,B,,… 两 两 互 上 斥 , 显 然 AB]1,AB,,… 也 两 两 互 斥 . 
故 依 加 法 定理 3.1, 有 

P(A) = P(ABI) + P(AB,) + … (3.17) 
再 由 条 件 概 率 的 定义 ,有 P(AB,)= P(B;)P(A|B,). 代 入 上 式 得 
P(A) = P(B1)P(A|BI) + P(B,)P(A|B,) +… 
(3.18) 
公式 (3.18) 就 称 为 “全 概率 公式 ”. 这 名 称 的 来 由 ,从 公式 (3.17) 和 和 
(3.18) 可 以 悟 出 ;“ 全 部 ”概率 P(A ) 被 分 解 成 了 许多 部 分 之 和 . 它 
的 理论 和 实用 意义 在 于 :在 较 复 杂 的 情况 下 直接 算 P(A ) 不 易 , 但 
A 总 是 随 某 个 已; 伴 出 ,适当 去 构造 这 一 组 B; 往往 可 以 简化 计算 . 
这 种 思想 应 用 的 一 个 实例 是 例 3.5 中 算 “ 乙 最 终 获 胜 ” 这 事件 A 
的 概率 .我 们 在 该 例 中 已 指出 ; A 必 伴 随 以 下 三 种 互 斥 情况 之 一 
而 发 生 : 乙 ;甲乙 ; 甲 甲 .只 是 该 例 的 特殊 性 使 我 们 可 只 用 加 法 定理 
而 不 必 求 助 于 全 概率 公式 . 

这 公式 还 可 以 从 另 一 个 角度 去 理解 .把 B, 看 作为 导致 事件 A 
发 生 的 一 种 可 能 途径 . 对 不 同 途径 , A 发 生 的 概率 即 条 件 概率 
P(A1B) 各 各 不 同 ,而 采取 哪个 途径 却 是 随机 的 .直观 上 易 理 解 : 
在 这 种 机 制 下 ,A 的 综合 概率 P(A ) 应 在 最 小 的 P(A|B,) 和 最 大 
的 P(A1B;) 之 间 , 它 也 不 一 定 是 所 有 P(A1B) 的 算术 平均 ,因为 
各 途径 被 使 用 的 机 会 P(B;) 各 各 不 同 ,正确 的 答案 如 所 预期 ,应 
是 诸 P(A|B;),i=1,2,…, 以 P(B,),i=1,2,… 为 权 的 加 权 平 均 
值 .一 个 形象 的 例子 如 下 : 某 中 学 有 若干 个 毕业 班 ,各 班 升学 率 不 
同 .其 总 升学 率 , 是 各 班 升学 率 的 加 权 平 均 , 其 权 与 各 班 学 生 数 成 
比例 .又 如 才干 工厂 生产 同一 产品 ,其 废品 率 各 各 不 同 . 若 将 各 厂 
产品 汇总 , 则 总 废品 率 为 各 厂 废品 率 之 加 权 平 均 , 其 权 与 各 厂 产 量 
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成 比例 .再 举 一 个 例 . 

例 3.7 设 一 个 家 庭 有 & 个 小 孩 的 概率 为 pi ,k= 二 0,1,2,…， 
又 设 各 小 孩 的 性 别 独 立 . 且 生 男 、 女 孩 的 概率 各 为 1 人 2. 试 求 事件 
A = {家庭 中 所 有 小 孩 为 同一 性 别 | 的 概率 . 

引进 事件 B; = | 家庭 中 有 & 个 小 孩 上 , 则 Bo,Bi,… 构 成 完 
事件 群 ,P(B)= pi, 现 考虑 P(A|B,). 约 定 当 名 =0 时 其 值 为 1. 
者 上 之 1, 则 个 小 孩 性 别 全 同 有 两 种 可 能 : 全 为 男孩 ,概率 
(1 人 2)*; 全 为 女孩 ,概率 也 是 (1/2)*. 因 

P(A |1B,) = 2(1/2) = 1 之 1 

由 此 ,用 全 概率 公式 ,得 出 


P(A) = po + > pe/2*"! 
=i 


贝 叶 斯 公式 
在 全 概率 公式 的 假定 之 下 ,有 
P(BIA) =P(AB;)/P(A) 
=P(B)P(AIB;)/2P(B,)P(AIB,) (3.19) 
这 个 公式 就 叫做 贝 叶 斯 公式 ,是 概率 论 中 的 -一 个 著名 的 公式 . 这 个 
公式 首先 出 现在 英国 学 者 工 . 贝 叶 斯 (1702 一 1761) 去 世 后 的 1763 
年 的 一 项 著作 中 . 
从 形式 推导 上 看 ,这 个 公式 平淡 无 奇 , 它 不 过 是 条 件 概率 定义 
与 全 概率 公式 的 简单 推论 .其 所 以 著名 ,在 其 现实 以 至 哲理 意义 的 
解释 上 : 先 看 P(B1),P(B,),…, 它 是 在 没有 进一步 的 信息 (不 知 
事件 A 是 否 发 生 ) 的 情况 下 ,人 们 对 诸 事件 Bi,B,,… 发 生 可 能 性 
大 小 的 认识 .现在 有 了 新 的 信息 (知道 A 发 生 ), 人 们 对 Bi,B，,… 
发 生 可 能 性 大 小 有 了 新 的 估价 .这 种 情况 在 日 常生 活 中 也 是 屡 见 
不 鲜 的 : 原 以 为 不 其 可 能 的 一 种 情况 ,可 以 因 某 种 事件 的 发 生 而 变 
得 其 为 可 能 ,或 者 相反 . 贝 叶 斯 公式 从 数量 上 刻画 了 这 种 变化 . 
如 有 果 我 们 把 事件 A 看 成 “结果 ” ,把 诸 事件 BI,B,,… 和 看 成 导 
致 这 结果 的 可 能 的 “原因 ”, 则 可 以 形象 地 把 全 概率 公式 看 作成 为 
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“由 原因 推 结 果 ”; 而 贝 叶 斯 公式 则 恰好 相反 ,其 作用 在 于 “由 结果 
推 原因 ”: 现 在 有 一 个 “结果 ”A 已 发 生 了 ,在 众多 可 能 的 “原因 ” 
中 ,到底 是 哪 一 个 导致 了 这 结果 ? 这 是 一 个 在 日 常生 活 和 科学 技 
术 中 党 要 问 到 的 问题 . 贝 叶 斯 公式 说 ,各 原因 可 能 性 大 小 与 P(B.， 
1 A) 成 比例 .例如 , 某 地 区 发 生 了 一 起 刑事 案件 , 按 平日 掌握 的 资 
料 ,嫌疑 人 有 张 三 . 李 四 …… 等 人 ,在 不 知道 案情 细节 (事件 A ) 之 
前 ,人 们 对 上 述 诸 人 作案 的 可 能 性 有 个 估计 (相当 于 已 (Bi )， 
P(B3)…), 那 是 基于 他 们 过 去 在 局 子 里 的 记录 .但 在 知道 案情 细 
亡 以 后 ,这 个 估计 就 有 了 变化 ,比方 说 ,原来 以 为 不 其 可 能 的 张 三 ， 
现在 成 了 重点 嫌疑 人 . 

由 以 上 的 讨论 也 不 难看 出 此 公式 在 统计 上 的 作用 .在 统计 学 
中 ,是 依 徘 收 集 的 数据 (相当 于 此 处 的 事件 A) 去 寻找 所 感 兴趣 的 
问题 的 管 案 . 这 是 一 个 “由 结果 找 原因 ”性 质 的 过 程 ,故而 贝 叶 斯 公 
式 有 用 武之 地 .事实 上 ,依据 这 个 公式 的 思想 发 展 了 一 整套 统计 推 
断 方法 ,叫做 “ 贝 叶 斯 统计 ”. 在 本 书后 面 的 章节 中 将 论 及 贝 叶 斯 统 
计 中 的 某 些 方法 . 

下 述 简 单 例子 可 能 有 助 于 理解 上 述 论 点 . 

例 3.8 有 三 个 盒子 Cl,C2z ,C3, 各 有 100 个 球 ,其 中 Ci 盒 含 
昌 球 80 个 , 红 球 10 个 , 黑 球 10 个 ; C， 为 白 10. 红 80 . 黑 10;C:; 为 
日 10, 红 10, 黑 80. 现 从 这 三 盒 中 随机 地 抽出 一 个 (每 盒 被 抽 的 概 
率 为 173) ,然后 从 所 抽出 的 盒 中 随机 抽出 一 个 球 ( 每 球 被 抽 的 概 
率 为 0.01) ,结果 抽出 者 为 白 球 . 问 “ 该 白 球 是 从 C, 盒 中 抽出 ”的 
可 能 性 有 多 大 ? i=1,2,3. 

记 B;= ;抽出 的 为 C; 盒 1,i=1,2,3; A = | 抽出 白 球 | ,要 求 
的 是 条 件 概率 P(B;|A). 按 假定 有 

P(BI) = P(B,) = P(B;) = 173 

P(A|B1) = 0.8,P(A|B,) = 0.1,P(A|B;3) = 0.1 
代入 (3.18), 算 出 . 

P(Bi|A)= 0.8,P(B;| A) = 0.1,P(B3|A) = 0.1 

因为 Cl 盒 所 含 日 球 最 多 , 故 在 已 知 抽出 白 球 的 情况 下 ,该 球 
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系 来 自 C; 盒 的 可 能 性 也 最 大 ,理所当然 . 可 能 仍 有 读者 不 完全 了 
然 于 心 , 则 可 以 设想 这 么 一 个 试验 :准备 两 张 纸 ,把 例 中 的 试验 一 
次 又 一 次 的 做 下 去 :每 抽出 一 个 盒 ,在 左边 的 纸 上 记 下 其 为 C1 或 
C2; 或 C3( 不 管 从 该 盒 中 抽出 的 球 如 何 ) ,而 只 有 在 抽出 的 球 为 日 
球 时 , 才 在 右边 纸 上 记 下 该 盒 为 Ci 或 C，、C;. 在 进行 了 极 大 量 次 
数 试验 后 ,会 发 现 左 边 纸 上 Ci 的 比例 很 接近 1/3 , 而 在 右边 纸 上 
Ci 的 比例 则 很 接近 0.8. 

例 3.9 设 某 种 病菌 在 人 口中 的 带菌 率 为 0.03. 当 检 查 时 ,由 
于 技术 及 操作 之 不 完善 以 及 种 种 特殊 原因 ,使 带菌 者 未 必 检 出 阳 
性 反应 而 不 带菌 者 也 可 能 呈 阳 性 反应 .假定 

P( 阳 性 | 带菌 ) = 0.99,P( 阳 性 | 带菌 ) = 0.01 
P( 阳 性 | 不 带菌 ) = 0.05,P( 阴 性 | 不 带菌 ) = 0.95 

现 设 某 人 检 出 阳性 , 癌 “ 他 带菌 ”的 概率 是 多 少 ? 

此 问题 相当 于 P(Bi)=0.03,P(B,)=0.97, 且 

P(AIB) = 0.99, P(A|B,) = 0.05 

所 求 的 概率 为 P(B1|A). 按 公式 (3.18) 算 出 

(0.03)(0.99)/A(0.03)(0.99) + (0.97)(0.05)] = 0.380 
就 是 说 ,即使 你 检 出 阳性 , 尚 可 不 必 过 早 下 结论 你 一 定 带 菌 了 , 实 
际 上 这 种 可 能 性 尚 不 到 百 分 之 四 十 . 

这 个 例子 很 值得 玩味 , 且 对 其 “思维 定 势 "中 无 概率 成 分 的 人 
来 说 ,简直 有 点 难以 置信 .说 穿 了 ,理由 简单 之 极 .由 于 带菌 率 极 
低 , 在 全 人 口中 绝 大 部 分 不 带菌 . 由 于 检验 方法 之 不 完善 ,在 这 大 
批 人 中 会 检 出 许多 呈 阳 性 者 , 男 一 方面 ,带菌 者 在 全 人 口中 很 少 ， 
即使 全 检 出 呈 阳 性 ,在 这 两 部 分 呈 阳 性 者 的 总 和 中 也 只 占 相 对 较 
小 的 一 部 分 ,而 大 部 分 属于 “虚报 ”性 质 . 这 个 例子 说 明 ,提高 精确 
度 在 这 类 检验 中 极为 重要 . 

一 个 不 懂 概 率 的 人 可 能 会 这 样 推理 :由 于 不 带菌 时 检 出 阳性 
的 机 会 才 0.05. 我 现在 呈 阳 性 ,说 明 我 有 1 一 0.05 = 0.95 的 机 会 
带菌 .实际 不 然 .大 而 言 之 ,概率 思维 是 人 们 正确 观察 事物 而 必 备 
的 文化 修养 ,这 样 说 也 许 并 不 过 分 ! 
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习 题 


1. 有 5 个 事件 ,Ai,…,A;. 用 它们 表示 以 下 的 事件 : 

(a) Bl=1A;,…,As 中 至 多 发 生 2 个 | 

(b) B,= 1A1,…,As 中 至 少 发 生 2 个 | 

2. 证 明 : 若 A,B 为 两 事件 , 则 

(a) At+B=A+(B-A), 和 右边 两 事件 互 斥 ; 

(b) A+B=(A-B)+(B-A4)+AB, 右 边 三 事件 互 斥 . 

3.(A+B)-(A-B)=? 

4. 把 个 任意 事件 A1,…,A, 之 和 表 为 n 个 互 斥 事 件 之 和 . 

5. 通过 把 A + B+ C 表 为 适当 的 互 斥 事 件 之 和 ,以 证 明 
P(A+ B+C)=P(A)+ P(B)+ P(C) -~ P(AB) - P(BC) 

- P(CA)+ P(ABC) 
6. 有 没有 可 能 两 件 事 A,B 又 互 矿 又 独立 ? 
7.P(4-B)=P(A)- P(B) 是 否 必 成 立 9 何 时 成 立 ? 


8. 记 C = 1T4 十 IIB, 通过 A;, B; 及 其 对 立 事 件 表 出 C. 


9. 如 果 把 P(A1B)>P(A) 理 解 为 ! “B 对 A 有 促进 作用 ”, 则 直观 上 似 
乎 能 设想 如 下 的 结论 :“ 由 P(A1B)>>P(A) 及 P(B1C)>>P(B) 推 出 P(A| 
C)> P(A)"( 意 思 是 ;B 促进 A,C 促进 B, 故 C 应 促进 A). 举 一 简 例 证 明 上 
述 直 观看 法 不 对 . 

10. 证 明 : 者 A,C 独立 ,B,C 也 独立 ,又 A,B 再 斥 , 则 A+B 与 C 独 
i.. 

更 一 般 地 ,者 A,C 独立 ,B,C 独立 ,AB,C 也 独立 , 则 A+B 与 C 独立 . 
说 明 :上 一 结论 是 本 结论 的 特例 . 

11.( 接 上 题 ) 若 除了 “A,C 独立 ,B,C 独立 "之 外 , 别 无 其 他 条 件 , 则 推 
不 出 A+B 与 C 独立 , 试 举 一 反例 以 说 明之 . 

12. 车 A,C 独立 ,B,C 独立 ,A + B,C 也 独立 , 则 AB 与 C 独立 .但 若 
去 掉 “A+ B,C 也 独立 ”的 条 件 , 则 结论 不 再 成 立 . 举 一 反例 以 说 明之 . 

13. 办 一 件 事件 有 6 个 关节 ,必须 :中 第 1 个 关节 要 走 通 ,名 第 2,3 关节 
至 少 通 一 个 , 吧 第 4,5,6 关节 至 少 通 2 个 ,事情 才能 办 成 . 

(a) 设置 必须 的 事件 ,以 表 出 “事情 办 成 "这 个 事件 . 

(b) 大 各 关节 独立 且 每 关节 走 通 的 机 会 为 2/3. 求 事情 能 办 成 的 概率 . 
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14. 由 P(A1B)> P(A) 推 出 P(B 4A)> 已 (8B). 直观 上 怎样 解释 这 个 事 
实 . 

你 认为 ,由 P(A1B)>P(A),P(AIC)>P(A), 能 否 推 出 P(A|BC)> 
P(A)” 帮 认为 能 ,请 证 明之 ,各 认为 不 能 ,请 举 出 反例 . 

15. 由 P(A)>P(A1B) 推 出 P(A)<P(A1B). 指 出 一 种 可 能 的 直观 
解释 . 

16. 设 Al,As,…,A, 独立 ,而 B; = A; 或 A;( 不 同 的 i 可 以 不 一 样 , 例 
如 ,B= Al,B,= A,, 等 等 ),i = 1,…,n. 试 用 归纳 法 证 明 :; Bj,…,B, 也 独 
i.. 

17. 一 个 秘书 打 好 4 封 信 和 相应 的 4 个 信封 .但 她 将 这 4 封 信和 湖 机 地 放 
入 这 4 个 信封 中 , 问 “ 每 封 信和 都 放 得 不 对 位 "这 事件 的 概率 是 多 少 ? 

18. 一 盒 内 有 8 张 空 日 券 ,2 张 奖券 ,有 甲乙 两 三 人 按 这 个 次 序 和 以 下 
的 规则 ,各 从 此 盒 中 随机 抽出 一 张 .规则 如 下 :每 人 抽出 后 ,所 抽 那 张 不 放 回 
但 补 人 两 张 非 同类 券 ( 即 :如 抽出 奖券 , 则 放 回 2 张 空白 券 ,等 等 ). 问 甲乙 、 
两 中 奖 的 概率 各 有 多 大 ? 

19. 某 作家 的 全 集 共 pp 卷 , 现 买 来 n 套 ( 共 np 本 ) ,随机 地 分 成 交 堆 ,每 
堆 户 本 , 问 “ 每 堆 都 组 成 整套 全 集 " 这 事件 的 概率 为 多 少 . 

20. 在 例 1.1 中 ,把 胜 负 规 则 改 为 “ 谁 先 胜 四 局 者 为 胜 ”. 问 在 甲 2 胜 1 负 
的 情况 下 中 止 赌博 ,应 按 怎样 的 比例 瓜分 赌 本 才 算 公平 ? 

21. 把 例 3.1 中 的 事件 B 的 定义 改 为 :B= | 至 少 有 一 个 骨 子 掷 出 侵 
点 | , 求 该 例 中 事件 A 的 条 件 概率 P(A1B). 

直观 上 看 结果 应 相同 ,但 算出 的 结果 不 同 , 如 何 解释 ? 

22. 在 例 2.3 中 ,把 “ 排 成 一 列 " 改 为 “ 排 成 一 圆圈 ”. 证明 例 中 所 说 的 事 
件 A 的 概率 为 | )("™ ) 


nn 
nn 2 
23. 四 人 打 桥 牌 , 问 ;至少 有 一 方 没有 A” 及 “至 少 有 一 方 恰 有 两 个 A” 
这 两 个 事件 的 概率 . 
24. 有 一 个 半径 为 1 的 圆周 C. 甲 乙 二 人 各 自 独立 地 从 圆周 上 随机 地 
取 一 点 ,将 两 点 连 成 一 条 避 1, 用 几何 概率 的 方法 计算 “圆心 到 ! 的 距离 不 小 
于 172 这 个 事件 的 概率 . 
25. 把 8 个 可 以 分 辨 的 球 随机 地 放 入 7 个 可 以 分 辨 的 盒子 中 , 问 “ 其 中 
有 两 个 盒 各 得 2 球 ,一 个 盒 得 3 球 ,一 个 盒 得 1 球 " 这 事件 的 概率 是 多 少 ? 
26. 设 男女 两 性 人 口 之 比 为 51:49. 又 设 男 人 色 育 率 为 2% ,女人 色 育 率 
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为 0.25% . 现 随机 拍 到 一 个 人 为 色盲 , 问 “ 该 人 为 男人 "的 概率 是 多 少 ? 

27. 设 有 7 个 独立 事件 Al1,…,A,, 其 概率 分 别 为 pi，,…,pPr, 记 上 = 
pi+ 十 pa. 设 0 芝 pj 达 1,i=1,…,n .证明 : 

(a)“Al,…,A, 都 不 发 生 " 这 个 事件 的 概率 小 于 e ?. 

(b)“A1,…,A, 中 至 少 发 生 k 个 "这 事件 的 概率 小 于 六 /人 . 

28. 投 撞 10 粒 均匀 筷子 ,记事 件 

A = 至少 有 2 粒 骨 子 出 么 点 
B = | 至少 有 1 粒 骨 子 出 么 点 | 
求 条 件 概 率 P(A1B). 

这 个 题 可 不 可 以 这 样 算 : 既 然 已 知 至 少 毛 出 一 个 么 点 ,不 妨 ( 因 各 骨 子 地 
位 对 称 ) 就 设 第 一 粒 仍 子 掷 出 么 点 .因而 所 求 的 条 件 概 率 为 : 掷 9 粒 蜗 子 至 少 
出 现 一 个 么 的 概率 , 即 1 一 (5/6)°. 为 什么 ? 

29. 假定 某 种 病菌 在 全 人 口 的 带菌 率 为 10% ,又 在 检测 时 ,带菌 者 呈 阳 、 
阴性 反应 的 概率 为 0.95 和 0.05, 而 不 带菌 者 呈 阳 、 阴 性 反应 的 概率 则 为 
0.01 和 0.99. 今 某 人 独立 地 检测 三 次 ,发 现 2 次 呈 阳 性 反应 ,1 次 呈 阴 性 反 
应 . 问 :“ 该 人 为 带菌 者 "的 概率 是 多 少 ? 

30. 甲乙 二 人 约定 了 这 样 一 个 赌博 规则 :有 无 穷 个 盒子 ,编号 为 n 的 盒 
子 中 ,有 nn 红 球 1 日 球 ,n=1,2,…, 然 后 甲 拿 一 个 均匀 铜板 据 到 出 现 正面 为 
止 . 若 到 这 时 甲 掷 了 ?= 次 , 则 甲 在 编号 为 n 的 盒子 中 抽出 一 个 球 ,如 抽 到 白 
球 算 甲 胜 ,否则 乙 胜 .你 认为 这 规则 对 淮 更 有 利 ? 
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第 二 章 ” 随 机 变量 及 概率 分 布 


2.1 一 维 随 机 变量 
2.1.1 随机 变量 的 概念 


顾名思义 ,随机 变量 就 是 “其 值 随机 会 而 定 的 变量 ,正如 随机 
事件 是 “其 发 生 与 否 随机 会 而 定 ” 的 事件 ,机 会 表现 为 试验 结果 ,一 
个 随机 试验 有 许多 可 能 的 结果 ,到底 出 现 哪 一 个 要 看 机 会 , 即 有 一 
定 的 概率 .最 简单 的 例子 莫如 掷 仍 子 , 掷 出 的 点 数 X 是 一 个 随机 
变量 , 它 可 以 取 1,…,6 等 6 个 值 .到 底 是 哪 一 个 ,要 等 挪 了 骨 子 以 
后 才 知 道 . 因 此 又 可 以 说 ,随机 变量 就 是 试验 结果 的 函数 .从 这 一 
点 看 , 它 与 通 间 的 函数 概念 又 没有 什么 不 同 . 把 握 这 个 概念 的 关键 
之 点 在 于 试验 前 后 之 分 :在 试验 前 ,我 们 不 能 预知 它 将 取 何 值 ,这 
要 赁 机 会 ， 随 机 -的 意思 就 在 这 里 ,一旦 试验 后 , 取 值 就 确定 了 .上 比 
如 你 在 3 月 31 日 买 了 一 张 奖券 ,到 6 月 30 开奖. 当 你 买 下 这 张 奖 
券 的 后 我 就 对 你 说 ;你 中 奖 的 金额 X 是 一 个 随机 变量 ,其 值 要 到 6 
月 30 日 “抽奖 试验 "做 过 以 后 才能 知道 . 
明白 了 这 一 点 就 不 难 举 出 一 大 堆 随 机 变量 的 例子 .比如 ,你 在 
某 厂 大 批 产 品 中 随机 地 抽出 100 个 ,其 中 所 含 废品 数 Xi; 一 月 内 某 
交通 路 口 的 事故 数 X ;用 天 平 释 量 某 物 体 的 重量 的 误差 XI; 随意 
在 市 场 上 买 来 一 架 电视 机 ,其 使 用 寿命 X 等 等 ,都 是 随机 变量 . 
随机 变量 的 反面 是 所 请 “确定 性 变量 ”, 即 其 取 值 遵循 某 种 严 
格 的 规律 的 变量 .例如 你 以 每 小 时 a 公里 的 匀速 从 某 处 向 东 行 ， 
则 经 上 小 时 后 ,你 距 该 处 at 公里 .这 一 点 我 不 待 你 做 完 这 个 试验 
《 即 走 了 上 小 时 后 ) 就 能 准确 预知 .在 这 种 理想 的 条 件 下 ,你 与 该 处 
的 距离 X 并 非 随机 变量 .然而 ,你 的 速度 必然 会 受到 许多 因素 , 包 
括 随 机 性 因素 的 影响 ,而 成 为 不 能 预知 的 ,这 使 你 在 1 时 间 内 行走 
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的 距离 X 成 为 随机 变量 . 从 绝对 的 意义 讲 , 许 多 通常 视 为 确定 性 
变量 的 量 , 本 质 上 都 有 随机 性 ,只 是 由 于 随机 性 干扰 不 大 ,以 至 在 
所 要 求 的 精度 之 内 ,不 妨 把 它 作为 确定 性 变量 来 处 理 . 

青 考虑 一 个 打靶 的 试验 . 在 靶 面 上 取 定 一 个 直角 坐标 系 
Ozy, 则 命中 的 位 置 由 其 坐标 (X,Y) 来 刻画 ,X,Y 都 是 随机 变 
量 , 而 (X,Y) 则 称 为 一 个 二 维 随机 向 量 或 二 维 随 机 变量 ,多 维 随 
机 回 量 (Xi1,…,X; ) 的 意义 据 此 推广 .前 面 几 个 例子 中 的 XX 都 是 
一 维 随机 变量 ,通常 就 简称 随机 变量 . 

关于 随机 变量 (及 向 量 ) 的 研究 ,是 概率 论 的 中 心 内 容 .这 是 因 
为 ,对 于 一 个 随机 试验 ,我们 所 关心 的 往往 是 与 所 研究 的 特定 问题 
有 关 的 某 个 或 某 些 量 ,而 这 些 量 就 是 随机 变量 . 当然 ,有 时 我 们 所 
关心 的 是 某 个 或 某 些 特定 的 随机 事件 .例如 ,在 特定 一 群 人 中 ,年 
收入 十 万 元 以 上 的 高 收入 者 ,及 年 收入 在 8000 元 以 下 的 低 收 入 
者 ,各 自 的 比率 如 何 , 这 看 上 去 像 是 两 个 孤立 的 事件 .可 是 , 若 我 们 
引进 一 个 随机 变量 的 X: 

X = 随机 抽出 一 个 人 其 年 收入 

则 X 是 我 们 关心 的 随机 变量 .上述 两 个 事件 可 分 别 表 为 {X> 
100001 和 |iX< 3000}. 这 就 看 出 ;随机 事件 这 个 概念 实际 上 是 包容 
在 随机 变量 这 个 更 广 的 概念 之 内 .也 可 以 说 :随机 事件 是 从 静态 的 
观点 来 研究 随机 现象 ,而 随机 变量 则 是 一 种 动态 的 观点 ,一 如 数学 
分 析 中 的 常量 与 变量 的 区 分 那样 .变量 概念 是 高 等 数学 有 别 于 初 
等 数学 的 基础 概念 . 同样 ,概率 论 能 从 计算 一 些 孤 立 事 件 的 概念 发 
展 为 一 个 更 高 的 理论 体系 ,其 基础 概念 是 随机 变量 . 

随机 变量 按 其 可 能 取 的 值 的 全 体 的 性 质 , 区 分 为 两 大 类 . 

一 类 叫 离散 型 随机 变量 .其 特征 是 只 能 取 有 限 个 值 ,或 虽 则 在 
理论 上 讲 能 取 无 限 个 值 , 但 这 些 值 可 以 毫 无 遗漏 地 一 个 接 一 个 排 
列 出 来 .前 者 的 例子 如 掷 仍 子 的 点 数 X(6 个 可 能 值 ) ,从 大 批 产 品 
中 抽出 100 个 其 中 的 废品 数 X(101 个 可 能 值 ); 后 者 的 例子 如 一 
月 内 某 交 通路 口 的 车 祸 数 , 它 理 论 上 讲 可 以 取 0,1,2,… 等 任 一 非 
负 整数 为 值 .从 实用 的 观点 说 ,这 变量 也 只 能 取 有 限 个 值 . 例 如 ,可 
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肯定 它 不 会 超过 10” .但 由 于 不 像 前 两 例 那 样 有 一 个 明确 的 界线 ， 
不 如 把 它 视 为 能 取 无 穷 个 值 ,理论 上 倒 反 简便 些 . 

另 一 类 叫 连续 型 随机 变量 .这 种 变量 的 全 部 可 能 取 值 不 仅 是 
无 穷 多 的 ,并 且 还 不 能 无 遗漏 地 逐一 排列 ,而 是 充满 一 个 区 间 . 例 
如 秤 量 一 物体 重量 的 误差 ,由 于 我 们 难于 明确 指出 误差 的 可 能 范 
围 ,人 不妨 就 把 它 取 为 (一 0 ,ce ) 更 方便 .又 如 电视 机 的 寿命 ,其 范围 
可 取 为 (0,%), 也 是 一 种 抽象 . 

说 到 底 ,“ 连 续 型 变量 "这 个 概念 只 是 一 个 数学 上 的 抽象 .任何 
量 都 有 一 定单 位 ,都 只 能 在 该 单位 下 量 到 一 定 的 精度 , 故 必然 为 离 
散 的 .但 是 当 单 位 极 小 时 ,其 可 能 值 在 一 范围 内 会 很 密集 ,不 如 视 
为 连续 量 在 数学 上 更 易 处 理 . 其 次 ,关于 连续 型 随机 变量 这 个 概念 
还 需 补 充 其 一 个 重要 方面 ,这 留 到 本 节 2.1.3 段 再 谈 . 


2.1.2 离散 型 随机 变量 的 分 布 及 重要 例子 


饰 究 一 个 随机 变量 ,不 只 是 要 看 它 能 取 哪 些 值 ,更 重要 的 是 它 
取 各 种 什 的 概率 如 何 .例如 从 一 大 批 产 品 中 随机 抽出 100 个 其 中 
所 含 废品 数 X. 当 废品 率 小 时 ,X 取 0,1,… 等 小 值 的 概率 大 . 反 
之 , 右 废 品 率 很 高 , 则 X 取 大 值 的 概率 就 上 升 . 

定义 1.1 设 久 为 离散 型 随机 变量 ,其 全 部 可 能 值 为 {aj， 


as… | . 则 
pi = P(X = a;),i = 1,2, (1.1) 
称 为 X 的 概率 函数 . 
显然 有 
Pi 之 0,p1+ p>+*…=1 (1.2) 


后 一 式 是 根据 加 法 定理 ,因为 事件 |jX= ai, 或 a,,…| 为 必然 事 
件 , 而 又 可 表 为 一 些 互 斥 事件 |1X= ai,1X= oa … 之 和 . 
因此 ,概率 汶 数 (1.1) 给 出 了 :全 部 概率 1 是 如 何在 其 可 能 值 
之 问 分配 的 .或 者 说 , 它 指出 了 概率 1 在 其 可 能 值 集 {a1 ,a,,…| 
上 的 分 布 情况 .有 鉴于 此 , 常 把 (1.1) 称 为 随机 变量 X 的 “概率 分 
布 ”. 它 可 以 列表 的 形式 给 出 ， 
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可 能 值 |al ca … a 
(1.3) 


概 率 | pl p2 i Pi 
有 时 也 把 (1.3) 称 为 X 的 分 布 表 . 它 也 可 以 形象 地 用 图 2.1 表 出 . 
图 中 横 轴 上 标 出 可 能 值 之 坐标 a; ,而 在 a; 处 的 竖 线 之 长 则 表示 事 
件 iX= ai| 的 概率 . 


网 2.1 


例如 , 掷 两 粒 均 匀 般 子 , 以 X 记 出 现 点 数 之 和 , 则 X 取 2， 
3,…,12 等 共 11 个 可 能 值 . 要 确定 其 概率 分 布 , 只 好 对 上 述 每 个 
去 计算 P(X= 2), 例 如 i=6. 投 两 个 骨 子 可 出 现 36 种 不 同 的 但 等 
可 能 的 组 合 ,其 中 有 利于 事件 { 久 =61 的 组 合 有 5 种 , 即 (1,5)， 
(5,1),(2,4),(4,2),(3,3). 故 pe 二 P(X=6)=5/36. 类 似 地 算出 
其 他 p, .XX 的 分 布 表 为 

可 能 值 2 3 4 5 6 7 8 9 10 1 12 


概 率 |363 人 3 新 36 亲 和 亲 功 和 芒 


(1.4) 
对 离散 型 变量 ,用 概率 函数 去 表达 其 概率 分 布 是 最 方便 的 .也 
可 以 用 下 面 定 义 的 分 布 函数 : 

定义 1.2 设 X 为 一 随机 变量 , 则 函数 
P(Xzr)= Fr), -ce<x<oco (1.5) 
称 为 X 的 分 布 消 数 .注意 这 里 并 未 限定 X 为 离散 型 的 : 它 对 于 任 
何 随机 变量 都 有 定义 . 对 离散 型 随机 变量 而 言 ,概率 函数 与 分 布 函 
数 在 下 述 意义 上 是 等 价 的 , 即 知道 其 一 即 可 决定 另 一 个 .事实 上 ， 
吉 知 道 概率 函数 (1.1), 则 
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F(z) = P(X<7) = 2 eu 


这 个 和 号 的 意思 ,是 指 求 和 只 对 满足 条 件 w 委 z 的 那些 i 去 进行 . 
如 对 上 例 而 言 ,由 分 布 表 (1.4) 算 出 
F(-1) = 0,F(2.5) = 1/36, 
F(S)= (1+2+3+4)/36 = 5/18 
等 等 . 反 过 来 ,由 分 布 函 数 也 易 决 定 分 布 表 . 仍 以 此 例 来 说 ,如 知道 
了 X 的 分 布 肾 数 下 (x ), 则 为 算 p,= P(X=7),i = 二 2,3,…,11, 只 
ixX<il= {XQ<i-1l+|{X= 
且 右 边 两 事件 互 斥 .于 是 
F(i) =P(X<i)= P(X<i-1)+P(X= i) 
=F(i—-1)+P(X = i) 

因而 p;=P(X-i)=F(i)- F(i-1). 

对 任何 随机 变量 X ,其 分 布 函数 F(z) 具有 下 面 的 一 般 性 质 : 

1 F(Cz) 是 单调 非 降 的 : 当 (zi 必 xz) 时 ,有 F(Xi)<F( Zr). 

这 是 因为 当 zi< zz 时 ,事件 {Xxz1 1 蕴含 事件 {Xx1, 因 
而 前 者 的 概率 不 能 超过 后 者 的 概率 . 

2” 当 zz 一 co 时 ,F(z) 一 1; 当 >z 一 -co 时 ,下 (z) 一 0. 

这 是 因为 , 当 z 一 co 时 ,|1Xsz|} 愈 来 愈 接近 于 必然 事件 , 故 其 
概率 , 即 F(z), 应 趋 于 必然 事件 的 概率 , 即 1. 类似 地 得 出 后 一 论 
新 

下 面 来 讨论 几 个 在 应 用 上 常见 的 离散 型 随机 变量 的 例子 . 

例 1.1 设 某 事 件 A 在 一 次 试验 中 发 生 的 概率 为 p. 现 把 这 
试验 独立 地 重复 次, 以久 记 A 在 这 nn 次 试验 中 发 生 的 次 数 . 则 
X 可 取 0,1,…,n 等 值 .为 确定 其 概率 分 布 ,考虑 事件 {X= i .要 
这 个 事件 发 生 ,必须 在 这 2” 次 试验 的 原始 记录 

AA AA:…AAA 
中 ,有 i 个 A,n 一 i 个 A. 每 个 A 有 概率 p 而 每 个 A 有 概率 1 一 上 py. 
又 ?2 次 试验 独立 表示 在 每 次 中 A 出 现 与 否 与 其 他 次 试验 的 结 
.46 . 


果 独 立 . 因此 概率 乘法 定理 给 出 :每 个 这 样 的 原始 结果 序列 发 生 的 
概率 ,为 pr(1-p)”-i. 又 因为 在 nn 个 位 置 中 A 可 以 占据 任何 i 个 
位 置 , 故 一 共有 (") 种 可 能 .由 此 得 出 
p; = b(i;n,p) = (jo — p)” ,i = 0,1,.…,n (1.6) 
X 所 遵从 的 概率 分 布 (1.6) 称 为 二 项 分 布 ,并 和 常 记 为 
B(2 ,pp). 以 后 , 当 随 机 变量 X 服从 基 种 分 布下 时 ,我 们 用 X 一 开 
来 表达 这 一 点 .例如 ,XX 服从 二 项 分 布 就 记 为 X 一 B(z 户 ). 
二 项 分 布 是 最 重要 的 离散 型 概率 分 布 之 一 .上 面 已 指出 :变量 
X 服从 这 个 分 布 有 两 个 重要 条 件 : 一 是 各 次 试验 的 条 件 是 稳定 
的 ,这 保证 了 事件 A 的 概率 在 各 次 试验 中 保持 不 变 ; 二 是 各 次 
试验 的 独立 性 .现实 生活 中 有 许多 现象 程度 不 同 地 符合 这 些 条 件 ， 
而 不 一 定 分 厘 不 差 .例如 , 某 厂 每 天 生产 nn 个 产品 ,车 原材料 质 
量 机 器 设备 、 工 人 操作 水 平等 在 一 段 时 期 内 大 体 保 持 稳 定 , 且 每 
件 产品 之 合格 与 否 与 其 他 产品 合格 与 否 并 无 显著 关联 , 则 每 日 的 
废品 数 X 大体 上 服从 二 项 分 布 .又 如 一 大 批 产品 N 个 ,其 废品 率 
为 p. 从 其 中 逐一 抽取 产品 检验 其 是 否 废 品 , 共 抽 ?2 个 . 若 每 次 抽 
出 检验 后 又 放 回 且 保 证 了 每 次 抽取 时 ,每 个 产品 有 同等 的 1AN 的 
机 会 被 抽出 , 则 这 个 产品 中 所 含 废品 数 X 就 相当 理想 地 遵从 二 
项 分 布 B(n,p)T 了 .反之 ,如 果 每 抽出 一 个 检验 后 即 不 放 回 去 , 则 
下 一 次 抽取 时 ,废品 率 已 起 了 变化 ,这 时 X 就 不 再 服从 二 项 分 布 
了 .但 是 ,者 广远 大于?”, 则 即使 不 放 回 ,对 废品 率 影 响 也 极 小 .这 
时 ,X 仍 可 近似 地 作为 二 项 分 布 来 处 理 . 
例 1.2 波 蛙 松 分 布 . 若 随 机 变量 X 的 可 能 取 值 为 0,1， 
2,…, 且 概率 分 布 为 
P(X=1)=e AI (1.7) 
则 称 X 服从 波 哇 松 分 布 , 常 记 为 XX 一 P(A). 此 处 A4>0 是 某 一 常 
数 .(1.7) 右 边 对 i =0,1,… 求 和 的 结果 为 1, 可 以 从 熟知 的 公式 @* 
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一 2 Ail 得 出 . 


这 个 分 布 也 是 最 重要 的 离散 型 分 布 之 一 ， 它 多 是 出 现在 当 X 
表示 在 一 定 的 时 间或 空间 内 出 现 的 事件 个 数 这 种 场合 . 前面 提 和 到 
的 在 一 定时 间 内 某 交 通路 口 所 发 生 的 事故 个 数 ,是 一 个 典型 的 例 
子 . 这 分 布 产 生 的 机 制 也 可 以 通过 这 个 例子 来 解释 .为 方便 计 , 设 
所 观察 的 这 段 时 间 为 [0,1). 取 一 个 很 大 的 自然 数 ,把 时 间 段 
.0,1) 分 为 等 长 的 nr 段 : 


10) = [tL,2) 
并 ni 天 A nt 


1/ = 站 = ,1 

作 几 个 假定 : 

1” 在 每 段 1; 内 , 恰 发 生 一 个 事故 的 概率 ,近似 地 与 这 段 时 
间 之 长 一 成 正比 ， 即 可 取 为 A/n. 又 假定 在 ”很 大 因而 1/n 很 小 
时 ,在 这 么 短暂 的 一 段 时 间 内 ,要 发 生 两 次 或 更 多 的 事故 是 不 
可 能 的 .因此 ,在 2 时 段 内 不 发 生 事故 的 概率 为 1- 1 . 

2 11,"…,l 各 段 是 否 发 生 事故 是 独立 的 . 

把 在 [0,1) 时 段 内 发 生 的 事故 数 X 视 作 在 2 个 小 时 段 1,…， 
l; 内 有 事故 的 时 段 数 , 则 按 上 述 1*,2°" 两 条 假定 ,XX 应 服从 二 项 分 
布 B(l(n,4/n). 于 是 


P(X = i)= 站 人 (人 六 (1.8) 
严格 讲 ,(1.8) 只 是 近似 成 立 而 非 严 格 等 式 . 因为 在 假定 1 中 ,在 


每 时 段 内 发 生 一 次 事故 的 概率 只 是 近似 地 为 4/n. 当 n 一 吕 取 极 
限时 ,就 得 到 确切 的 答案 .注意 当 nn 一 吕 时 


[fit, -人 > 
得 知 (1.8) 式 右边 以 e-M4/i1 为 极限 ,由 此 得 出 (1.7). 
从 上 述 推 导 看 出 : 波 哇 松 分 布 可 作为 二 项 分 布 的 极限 而 得 到 . 
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一 般 地 说 , 若 久 一 B(n,p), 其 中 很 大 ,p 很 小 而 np = 二 4 不 太 大 
时 , 则 X 的 分 布 接近 于 波 哇 松 分 布 P(X). 这 个 事实 在 所 述 条 件 下 
可 将 较 难 计算 的 二 项 分 布 转化 为 波 哇 松 分 布 去 计算 ,看 一 个 例子 . 

例 1.3 现在 需要 100 个 符合 规格 的 元 件 . 从 市 场 上 买 的 该 
元 件 有 废品 率 0.01. 故 如 只 买 100 个 , 则 它们 全 都 符合 规格 的 机 
会 丽 怕 不 大 ,为 此 ,我 们 买 100+ a 个 .a 这 样 取 ,以 使 “在 这 100 + 
a 个 元 件 中 至 少 有 100 个 符合 规格 ”这 事件 A 的 概率 不 小 于 
0.95. 问 wa 至 少 要 多 大 ? 

在 此 ,我 们 自然 假定 各 元 件 是 否 合格 是 独立 的 .以 X 记 在 这 
100+ a 个 元 件 中 所 含 废品 数 , 则 X 有 二 项 分 布 B(100++&4a， 
0.01). 事 件 A 即 事件 |1X 委 ci ,于 是 A 的 概率 为 


Sn as、/ 100 二 
P(A)= SP(X=i)= > | 7 ®)(0.01)1(0.99) re 
i=0 i=0 1 


(1.9) 
为 确定 最 小 的 a 使 P(4) 关 0.95 ,我 们 得 从 < =0 开始 ,对 a =0， 
1,2,… 依 次 计算 (1.9) 式 右边 之 值 ,直到 算出 宇 0.95 的 结果 为 上 . 
这 很 麻烦 . 
由 于 100+ a 这 个 数 较 大 而 0.01 很 小 , (100 + a)(0.01)= 
1+ a(0.01) 大 小 中 ,可 近似 地 用 波 哇 松 分 布 计算 .由 于 平均 在 100 
个 中 只 有 一 个 族 品 ,a 谅 必 相当 小 . 故 可 以 用 1 近似 地 取代 1+a 
(0.01) .由 此 ,X 近似 地 服从 波 哇 松 分 布 P(1) ,因而 
PLX 二 w) Si/il 


计算 出 当 4 =0,1,2,3 时 ,上 式 右 边 分 别 为 0.368,0.736,0.920 
和 0.981. 故 取 a=3 已 够 了 . 

除了 二 项 和 波 哇 松 这 两 个 最 重要 的 离散 型 分 布 外 ,还 有 几 个 
离散 型 分 布 ,其 重要 性 略 次 一 些 , 但 也 很 常用 .其 中 有 超 几 何 分 布 
与 负 二 项 分 布 . 

例 1.4 考虑 第 一 章 的 例 2.1, 以 X 记 从 个 产品 中 随机 抽 
出 ?2 个 里 面 含 废品 数 . 按 该 例 的 计算 ,X 的 分 布 为 (第 一 章 (2.7) 
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式 ): 
px=m=( (1.10) 
nn nn— nn 

至 于 m 的 取 值 范围 ,必须 0 世人 MM 及 nn 一 m 夺 N 一 M .例如 ,NN 
=500,2z=50,M=25, 则 mx 的 范围 为 0 过 mr 二 25.(1.10) 称 为 超 
几何 分 布 ,是 因为 其 形式 与 “ 超 几 何 函 数 的 级 数 展 式 的 系数 有 关 . 

这 个 分 布 在 涉及 抽样 的 问题 中 常用 ,特别 当 N 不 大 时 .因为 
通常 在 抽样 时 ,多 是 像 在 本 例 中 这 样 “ 无 放 回 的 ”, 即 已 抽出 的 个 体 
不 册 有 放 回 去 以 供 再 次 抽出 的 机 会 ,这 就 与 把 2 个 同时 抽出 的 效 
果 一 样 .如 果 一 个 一 个 地 抽 而 抽出 过 的 仍 放 回 , 则 如 在 例 1.1 中 已 
指出 的 ,结果 是 二 项 分 布 .在 例 1.1 中 也 曾 指 出 : 若 nAN 很 小 , 则 
放 回 与 不 放 回 差别 不 大 .由 此 可 见 , 在 这 种 情况 下 超 几 何 分 布 应 与 
二 项 分 布 很 接近 .确切 地 说 , 戎 XX 服从 超 几 何 分 布 (1.10), 则 当 吧 
固定 , MAN = pp 固定, N 一品 时 ,X 近似 地 服从 二 项 分 布 
B(n,p). 

例 1.5 为 了 检查 某 厂 产品 的 废品 率 p 大 小 ,有 两 个 试验 方 
案 可 采取 :一 是 从 该 三 产品 中 抽出 若干 个 ,检查 其 中 的 废品 数 XX， 
这 一 方案 导致 二 项 分 布 ,已 于 前 述 . 另 一 个 方案 是 先 指定 一 个 自然 
数 .一 个 一 个 地 从 该 厂 产 品 中 抽样 检查 ,直到 发 现 第 rv 个 废品 为 
止 .以 XX 记 到 当时 为 止 已 检 出 的 合格 品 个 数 . 显然 , 若 废 品 率 p 
小 , 则 X 倾向 于 取 较 大 之 值 , 反 之 当 户 大 时 , 则 X 倾向 于 取 小 值 . 
故 X 可 用 于 考究 p 的 目的 . 

为 计算 X 的 分 布 ,假定 各 次 抽取 的 结果 (是 废品 或 否 ) 是 独立 
的 , 且 每 次 抽 得 废品 的 概率 ,保持 固定 为 p. 考察 {X=i| 这 个 事 
件 , 为 使 这 个 事件 发 生 , 需 要 以 下 两 个 事件 同时 发 生 : 名 在 前 i + 
r 一 1 次 抽取 中 , 恰 有 r 一 1 个 废品 .名 第 i+y 次 抽出 废品 . 按 所 作 
假定 ,这 两 事件 的 概率 分 别 为 6(r 一 1;i+r-1,p) 和 pp. 再 由 独 
立 性 , 即 得 

P(X=i)=b(r-1l;itr-1,p)p 


. SO) 。 


-人 je) (1.11) 
(=0,1;2，…) 
这 个 分 布 称 为 负 二 项 分 布 .这 名 称 的 来 由 ,一 则 由 于 “ 负 指 数 二 项 
展开 式 " 
~" /—r . /i —1Y\. 
0 


i=0 i=0 
的 

= 之 / x 

i=0 "-—1 


中 令 z=1 一 jp 并 两 边 习 以 p” ,得 


[+7 一 | 
pp -py 
(这 验证 了 分 布 (1.11) 确 满足 (1.2)). 另 一 则 由 于 例 中 所 描述 的 斌 
验方 式 , 它 与 二 项 分 布 比 是 “ 反 其 道 而 行 之 ”: 二 项 分 布 是 定 下 总 抽 
样 个 数 而 把 废品 个 数 X 作为 变量 ; 负 二 项 分 布 则 相反 , 它 定 下 
废品 个 数 ; 而 把 总 抽样 次 数 减 去 作为 变量 ， 


-个 重要 的 特例 是 ; = 1. 这 时 , 注意 到 (0)= 1 之 约定 ， 


(1.11) 成 为 

P(X=17i)= p(l -pp)’,i = 0,1,2,… (1.12) 
概率 p ,pl(l1 一 万),pP(l 一 六 ,… 星 公 比 作为 1 一 p 的 几何 级 数 , 故 
分 布 (1.12) 又 常 称 为 几何 分 布 . 


2.1.3 连续 型 随机 变量 的 分 布 及 重要 例子 


连续 型 随机 变量 的 意义 已 在 2.1.1 段 中 解释 过 . 对 这 种 变量 

的 概率 分 布 ,不 能 用 像 离 散 型 变量 那 种 方法 去 描述 . 原因 在 于 ,这 

种 变量 的 取 值 充满 一 个 区 间 ,无 法 一 一 排出 .着 指定 一 个 值 < , 则 

变量 X 恰好 是 a 一 丝 不 差 , 事 实 上 不 可 能 .如 在 秤 量 误差 的 例 中 ， 

如 采 你 认定 天 平 上 的 读数 (刻度 ) 是 “无 限 精细 ”, 则 “误差 正好 为 

x 一 3 虽 原 则 上 不 能 排除 ,但 可 能 性 也 极 微 以 至 只 能 取 为 0. 如 在 
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靶 面 上 指定 一 个 几何 意义 下 的 点 { 即 只 有 位 置 而 无 任何 向 度 ), 则 
“射击 时 正好 命中 该 点 ”的 概率 ,也 只 能 取 为 0. 

刻画 连续 型 随机 变量 的 概率 分 布 的 一 个 方法 ,是 使 用 (1.5) 式 
所 定义 的 概率 分 布 图 数 .但 是 ,在 理论 和 实用 上 更 方便 因而 更 常用 
的 方法 ,是 使 用 所 谓 概率 密度 函数 "或 简称 密度 函数 ， 

定义 1.3 设 连续 性 随机 变量 X 有 概率 分 布 羡 数 臣 (zz), 则 
下 (Z) 的 导数 f(z) 二 下 (xx), 称 为 六 的 概率 密度 函数 . 

密度 图 数 这 名 词 的 来 由 可 解释 如 下 . 取 定 一 个 点 zx, 则 按 分 
布 范 数 的 定义 ,事件 jz<X 委 z+Pi 的 概率 (>0 为 常数 ) ,应 为 
F(z+t+h) 一 F(z). 所 以 ,比值 [下 (x+h) 一 F(x )j/Ah 可 以 解释 为 
在 z 点 附近 有 这么 长 的 区 间 (zx,x+ 甩 ) 内 ,单位 长 所 占有 的 概率 . 
令 有 >0, 则 这 个 比 的 极限 , 即 F(x)= f(z), 也 就 是 在 xz 点 处 (无 
穷 小 区 段 内 ) 单 位 长 的 概率 ,或 者 说 , 它 反映 了 概率 在 xz 点 处 的 
“密集 程度 ”. 你 可 以 设想 一 条 极 细 的 无 穷 长 的 金属 杆 , 总 质量 为 
1 ,概率 密度 相当 于 杆 上 各 点 的 质量 密度 . 

连续 型 随机 变量 X 的 密度 函数 f(x) 都 具有 以 下 三 条 基本 性 
质 : 

1 f(z)20 

2° | f(x)qz = 1 

3” 对 任何 常数 ec<b 有 ” 

Pla<X<6)= FLO) -Fa) = | (zr)dr (1.13) 

1 显然 .2 是 说 “全 部 概率 为 1”.3° 是 微 积 分 的 基本 定理 ( 定 积分 与 
导数 的 关系 ) 的 直接 应 用 .实际 上 ,2?" 是 3" 当 a= -co 和 8= co 的 
特例 . 

图 2.2(a),(b) 分 别 表 示 某 一 连续 型 变量 X 的 分 布 函数 政和 


* 由 于 连续 型 变量 取 一 个 点 的 概率 为 0, 故 区 间 的 端点 是 否 包 括 在 内 无 影响 ,也 就 
古 说 ,iass 和 oae<X<blla<Xs 和 ol 和 fa<X<o+ 这 四 个 事件 都 有 同 - -的 概率 
(1.13). 
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密度 函数 .从 密度 函数 的 图 上 可 以 明显 看 出 该 分 布 的 一 些 特点 . 
例如 概率 最 大 的 集中 区 在 jy 点 附近 ,而 在 这 点 的 两 边 呈 对 称 性 的 
衰减 .网 中 斜 线 标 出 部 分 的 面积 表示 变量 X 落 在 c,b 之 间 的 概 
率 . 这 些 特 点 从 分 布 函数 的 图 上 就 不 那么 容易 看 出 来 . 


fx) 


图 2.2 


下 面 举 一 些 重要 的 连续 型 分 布 的 例子 . 

例 1.6 正 态 分 布 . 

如 果 一 个 随机 变量 具有 概率 密度 函数 

f(x) = (V2xro)rierer2o -oo<z<oo (1.14) 

则 称 入 为 正 态 随机 变量 并 记 为 X~N(y,o?). 这 里 N 为 “Nor- 
mal 一 词 的 首 字母 .yx 和 都 是 常数 ,y 可 以 取 任 何 实数 值 而 0< 
o*<%. 它 们 称 为 这 个 分 布 的 “参数 ”, 其 概率 意义 将 在 第 三 音 说 
明 . 

家 要 证 明 f(z) 确 可 以 作为 一 个 概率 密度 .为 此 须 验 证 f(x) 


>0,] _/(z)dx = 1. 前 者 显然 .为 证 后 者 , 作 变 数 代 换 1 = (x - 
4K)/o ,转化 为 证 明 
1 = | e 2dt = VIx (1.15) 


为 证 此 式 ,考虑 


5 2 59 2 rr 2 2 
矿 = | er 2dz| e “du = et + 2drdu 


转化 成 极 坐 标 + = rcos60 ,wu = rsin0g ,上 和 式 转 化 为 
和 53 中 


27 oo 
I* = | dg| er 27rdr 一 2x 


即 (1.15). 
画 数 (1.14) 的 图 形 约 如 图 2.2b. 它 关于 w 点 对 称 , 而 后 往 两 
个 方向 衰减 ,属于 "两头 低 , 中 间 高 这 种 正常 状况 下 一 般 事物 下 所 
处 的 状态 .例如 一 群 人 的 身高 或 体重 ,特大 和 特 小 的 居 少 而 中 间 状 
态 的 居多 .举凡 人 的 收入 ,大 批 制造 的 同一 产品 的 某 一 指标 等 ,都 
在 不 同 程度 上 符合 这 一 分 布 .这 不 但 说 明了 “ 正 态 " 这 和 名字 的 来 由 ， 
也 说 明了 这 种 分 布 的 重要 性 . 正 态 分 布 还 有 理论 上 的 解释 ,这 一 点 
留待 下 一 章 3.4 节 再 谈 . 
当 y=1,0 =1 时 ,(1.14) 成 为 
f(r) = er 2/ VI (1.16) 
它 是 正 态 分 布 N(0,1) 的 密度 函数 . N (0,1) 称 为 “标准 正 态 分 
布 “. 在 概率 论著 作 中 ,其 密度 函数 和 分 布 水 数 常 分 别 记 为 g(x) 
和 (xz), 并 造 有 很 仔细 的 表 . 本 书 也 附 有 一 个 简单 的 @(z) 的 
表 . 标准 正 态 分 布 之 所 以 重要 ,一 个 原因 在 于 :任意 的 正 态 分 布 
N(p,o") 的 计算 很 容易 转化 为 标准 正 态 分 布 N(0,1). 事实 上 , 容 
匈 证 明 ， 
若 XX~ Np,o ), 则 Y= (X-Ap)M ~ N(0,1)(1.17) 
事实 上 
P(Y 达 xz) =P(X-— HU) s 妇 工 ) = P(X1+ or) 


= (Vax) erGrA 02e di 
=(V37) 1!) ”ee2dx 


其 导数 , 即 Y 的 密度 函数 , 正 是 (V2x)-1e-*2?. 这 证 明了 
(1.17). 

例如 ,X~N(1.5,2), 要 计算 P(--1 志 XX 过 2), 则 因 (X 一 
1.5)/2~N(0,1), 故 


2—1.5 


7 ”到 
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= P(-1.25 才 (xX-1.5)/2 0.25) 
= $0.25) - B(— 1.25) (1.18) 
然后 查 标准 正 态 分 布 B 的 表 . 表 上 只 有 B(x) 当 x 之 0 之 值 .对 
Z< 和 0, 可 利用 公式 
G(r)=1- $B(- zx) (1.19) 
而 转化 为 x >0 的 情况 . (1.19) 的 证 明 很 简单 : 
Bz)= (3x)! er hd = (Mar)!| ed 
= (V27) | ed (Vx) | ernd 
=1- BB(—z) 
用 (1.19), 由 (1.18) 式 得 
P(- 1 X22) = 6(0.25) + ®B(1.25) -1 


查 (x) 的 表 , 得 (0.25) =0.5987, 外 (1.25) =0.8944, 于 是 得 
到 P( 1X2) =0.4931. 


例 1.7 指数 分 布 . 
车 随机 变量 X 有 概率 密度 函数 : 
Me 和 民 , 当 过 >0 
f(x) = 0 yi (1.20) 


则 称 X 服从 指数 分 布 .其 中 1 >0 为 参数 * ,其 意义 将 在 后 面 阐 
明 . 

由 于 f(x)=0 当 委 0, 表 示 随 机 变量 取 负 值 的 概率 为 0:X 
只 取 正 值 . f(z ) 在 z=0 处 之 值 41>0, 故 密度 函数 F(z) 在 过 =0 
处 不 连续 .图 2.3 中 摘出 了 这 函数 当 和 =1( 虚 线 ) 和 1=2( 实 线 ) 
时 的 图 形 . 


变量 X 的 分 布 函 数 易 求 得 为 
z 0， 当 z 工 志 0 
F(x) = | fa = wu yiS0 (1.21) 


* 因为 *>0,x>0,(1,2) 式 e 祥 之 指数 -Xx 总 取 负 值 .由 于 这 个 原因 ,也 有 把 
《1.20) 称 为 负 指数 分 布 的 . 
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指数 分 布 最 常见 的 一 个 场合 是 寿 
命 分 布 . 设想 一 种 大 批 生 产 的 电子 元 
件 ,其 寿命 X 是 随机 变量 .以 下 (z) 记 
X 的 分 布 函数 .我 们 来 证 明 : 在 一 定 的 
条 件 下 , F(z) 就 是 (1.21). 

我 们 要 作 的 假定 ,从 技术 上 说 就 是 
“无 老化 .就 是 说 :“ 元 件 在 时 刻 x 尚 

图 2.3 能 正常 工作 的 条 件 下 ,其 失效 率 总 保持 

为 某 个 常数 A >0, 与 过 无 关 ”. 失 效率 

就 是 单位 长 度 时 间 内 失效 的 概率 .用 条 件 概率 的 形式 ,上 述 假定 可 
表 为 


P(x 过 XZr+th|lX2>r)/h=A,h->0 
此 式 解 释 如 下 :元 件 在 时 刻 xz 时 尚 正常 工作 ,表示 其 寿命 大 于 x， 
即 XX>z. 在 xz 处 ,长 为 h 的 时 间 段 内 失效 , 即 x+ 志 多 之 + 及. 把 
这 个 条 件 概率 除 以 时 间 段 之 长 h, 即 得 在 x 时 刻 的 平均 失效 率 . 
再 令 h 一 0, 得 瞬时 失效 率 , 按 假定 , 它 应 为 常数 4. 
按 条 件 概率 定义 ,注意 到 P(X>z)=1- 下 (zz) ,又 
IiX>riilr<X<Zr+h|= ir<X<Zrt+hl 


P(r XZr+h|lX>r)/h 
= P(x <XEr+h)/(h(l— F(zr))) 
= |(F(r+h)—-F(r))/h]/Al- F(zr)) 
— FF(r)/(l -~ F(r))= 7 
这 个 微分 方程 的 通 解 为 FE(z)=1- Ce 和 ( 当 z>0.z 委 0 时 
FLz) 为 0). 毅 数 C 可 用 初始 条 件 F(0) =0( 因 为 F(0)= P(X 过 
0), 而 寿命 二 0 的 概率 为 0) 定 出 为 1, 这 样 就 得 到 (1.21) 式 . 
从 这 个 推导 也 可 以 帘 见 参数 1 的 意义 .4 为 失效 率 . 失效 率 愈 
高 ,平均 寿命 就 愈 小 .下 一 章 ( 见 第 三 章 例 1.3) 将 证 明 :1-1! 就 是 平 
均 寿 命 . 
由 本 例 可 见 : 指 数 分 布 描述 了 无 老化 时 的 寿命 分 布 ,但 “无 老 
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化 "是 不 可 能 的 ,因而 只 是 一 种 近似 .对 一 些 寿命 长 的 元 件 , 在 初期 
阶段 老化 现象 很 小 .在 这 一 阶段 ,指数 分 布 比较 确切 地 描述 了 其 寿 
命 分 布 情况 .又 如 人 的 寿命 ,一 般 , 在 50 岁 或 60 岁 以 前 ,由 于 生理 
上 老化 而 死亡 的 因素 是 次 要 的 . 若 排 除 那 些 意 外 情况 ,人 的 寿命 分 
布 在 这 个 阶段 也 应 接近 指数 分 布 . 

例 1.8 威 布尔 分 布 . 

硅 考 虑 老化 , 则 应 取 失 效率 随时 间 而 上 升 ,不 能 为 常数 ,而 应 
取 为 一 个 z 的 增 函 数 , 例 如 Ax” ,对 某 个 常数 4>>0, wm >0. 在 这 个 
条 件 下 , 按 上 例 的 推理 ,将 得 出 :寿命 分 布 F(z) 满足 微分 方程 
F(z)/1- F(z)j]= Xx”, 此 与 初始 条 件 F(0)=0 结合 ,得 出 


F(x) = 1 -etm De 


取 a= m+1(a 这 1), 并 把 A/A(m +1) 记 为 4, 得 出 


F(z)=1-e*v,r>0 (1.22) 
而 F(x)=0 当 福 过 0. 此 分 布 之 密度 函数 为 


a-l Ar 
f(x) = | e ,rT>0 (1.23) 
0 ， rT 世 0 


(1.22) 和 (1.23) 分 别称 为 威 布 尔 分 布 函 数 和 威 布尔 密度 函数 . 它 
与 指数 分 布 一 样 , 在 可 靠 性 统计 分 析 中 占 重要 的 地 位 .实际 上 指数 
分 布 是 威 布尔 分 布 当 a =1 时 的 特例 . 
例 1.9 均匀 分 布 . 
. 设 随 机 变量 X 有 概率 密度 函数 
1/ 人 -aa), 当 & 委 蔗 生 8 

f(x) = 0 其 他 芭 (1.24) 
则 称 X 服从 区 间 [a ,65] 上 的 均匀 分 布 ,并 常 记 为 X 一 Ra,p). 这 
里 a ,5 都 是 常数 ,- ce<a<p<ceo. 均 匀 分 布 这 个 名 称 的 来 由 很 
明显 :因为 密度 消 数 /在 区 间 [a ,5] 上 为 常数 , 故 在 这 区 间 上 , 概 
率 在 各 处 的 密集 程度 一 样 .或 者 说 ,概率 均匀 地 分 布 在 这 区 间 上 . 
均匀 分 布 R(a ,5) 的 分 布 丽 数 是 
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0 ， 工 生 aa 

TE (1.25) 
1， 工 宇 引 

了 和 下 的 图 形 分 别 如 图 2.4a,b 所 示 . 


(b) 


在 计算 时 因 “ 四 舍 五 人 ”而 产生 的 误差 , 若 以 被 舍 入 的 那 一 位 
的 前 一 位 为 单位 , 则 可 认为 这 个 舍 人 误差 服从 均匀 分 布 R( 一 1/2， 
1L2) .均匀 分 布 的 一 个 好 处 是 :借助 于 它 容 易 实现 对 分 布 的 模拟 . 
首先 , 知 以 某 种 方法 产生 “随机 数 ”( 即 像 0,1,…,9 这 十 个 数字 出 
现 的 概率 都 是 1710 的 那 种 数字 , 它 可 以 用 “ 摸 球 ”等 方式 来 实现 . 
实用 上 用 计算 机 程序 可 在 短 时 间 内 产生 大 量 随 机 数 一 一 严格 地 
说 ,计算 机 中 产生 的 并 非 完全 随机 ,但 很 接近 , 故 有 时 称 为 伪 随 机 
数 ), 则 如 取 n 足够 大 ,而 独立 地 产生 7 个 随机 数字 ai,……,a， 时， 
则 X=0'.aiaz…a 就 很 接近 于 [0,1] 均 匀 分 布 R(0,1). 对 一 般 分 
布 另 数 F(x), 阁下 (xz) 处 处 连续 且 严 格 上 升 , 则 其 反 函 数 G 存 
在 ,这 时 易 见 , 若 X~R(0,1), 则 G(CX) 一 下 .事实 上 ,1G(X) 云 
zx| 这 个 事件 ,就 是 {FF(G(X)) 过 F(x)1 即 |X 才 F(z)|, 因 而 ( 注 
意 到 R(0,1) 的 分 布 函数 为 F(x)=x 当 0<zx<1) 

P(G(X)<z)= P(XCF(r)) = F(z) 
这 证 明了 G(X)~ 下 .这 样 ,用 上 述 模 拟 方法 产生 XX 的 模拟 值 后 ， 
代入 G 中 即 得 分 布下 的 模拟 值 . 这 个 方法 在 模拟 研究 中 常用 ,而 
显示 了 均匀 分 布 的 重要 性 ,均匀 分 布 还 有 其 他 重要 的 理论 性 质 , 不 
能 在 此 细 论 了 . 
四 $8 四 


还 有 几 个 在 统计 应 用 上 很 重要 的 连续 型 分 布 ,这 留待 本 章 
2.4 节 去 讨论 . 


2.2 多 维 随机 变量 (随机 向 量 ) 
2.2.1 离散 型 随机 向 量 的 分 布 


随机 向 量 的 概念 在 2.1 节 2.1.1 段 中 已 提 及 过 了 .一般 , 设 X 
= (Xi , 义 ;,…, 闵 , ) 为 一 好 维 向 量 , 其 每 个 分 量 , 即 XXX 都 
是 一 维 随机 变量 , 则 称 X 是 一 个 2” 维 随机 回 量 或 ” 维 随 机 变量 . 
与 随机 变量 一 样 , 随 机 向 量 也 有 离散 型 和 连续 型 之 分 .本 段 先 
考虑 前 者 ,一 个 随机 疝 量 X= (Xi;,…,X;), 如 果 其 每 一 个 分 量 X; 
都 是 一 维 离散 型 随机 变量 , 则 称 X 为 离散 型 的 . 
定义 2.1 以 fa;,aw,…'| 记 XX; 的 全 部 可 能 值 ,i = 1,2,… 
则 事件 1Xi=al ;XX2= a2 “Aa i 的 概率 
plj1,j2,°" ,jn) = P(X1 = a1j,，X2 = i 一 anj,) 
7 三 1,2,…,1 = 1,2, vo ,jn = 1， 2 ,. (2.1) 
称 为 随机 向 量 X = (X ，… ,区 ) 的 概率 函数 或 概率 分 布 ,概率 函 
数 应 满足 条 件 : 
p(j1,j2,…' ,jn) 之 0， 2 2 2 pj1,j2, ,1 ) =1 


(2.2) 
例 2.1 图 2.5 所 示 的 二 维 离散 型 随机 向 量 X= (Xi,X2>) 的 
概率 分 布 为 
P(X = 2,X, = 1) = 1/3 
P(X! = 2,X> = 2.5) = 1/4 
P(X! = 5,X, = 3) = 5/12 
从 图 上 看 出 ,Xi 的 可 能 值 为 2 和 5,X, 的 可 能 值 为 1,2.$S 和 3. 故 
形式 上 看 ,X= (Xi,X2) 应 有 6 组 可 能 值 , 即 (2,1),(2,2.5)， 
(2,3),(5,1),(5,2.5),(5,3).XX 的 概率 分 布告 诉 我 们 ,实际 上 只 
有 S09 . 


有 第 1,2,6 组 是 真正 的 可 能 值 ,但 
这 并 无 关系 :对 一 组 不 可 能 的 值 ， 
只 要 把 它 的 概率 定 为 0 就 行 了 .这 
一 做 法 使 我 们 可 以 把 离散 型 分 布 
统一 写成 (2.1) 的 格式 ,在 理论 上 
有 其 方便 之 处 .自然 ,在 具体 例子 
中 ,如 例 2.1 并 无 必要 硬 凑 成 那个 
图 2.5 形式 ,只 要 指出 概率 大 于 0 的 那 部 
分 就 行 了 . 


例 2.2 多 项 分 布 . 

多 项 分 布 是 最 重要 的 离散 型 多 维 分 布 . 设 Al,A,,…,A, 是 
某 一 试验 之 下 的 完备 事件 群 , 即 事件 A1 ,…,A, 两 两 互 斥 ,其 和 为 
必然 事件 (每 次 试验 时 ,事件 Ai,…,A， 必 发 生 一 个 且 只 发 生 一 
个 ) .分 别 以 pi1,p2,…, pa 记事 件 A1,A,,…,A, 的 概率 , 则 请 之 
0,p1t+**+ p=1. 

现在 将 试验 独立 地 重复 N 次 ,而 以 X; 记 在 这 NN 次 试验 中 事 
件 A; 出 现 的 次 数 ,i 二 1,…,n, 则 X= 《XX1,…,X, ) 为 一 n 维 随 机 
向 量 . 它 取 值 的 范围 是 :Xi ,…,X, 都 是 非 负 整数 且 其 和 为 N.X 
的 概率 分 布 就 叫做 多 项 分 布 ,有 时 记 为 M(N ;pl,…,p,). 为 定 出 
这 分 布 ,要 计算 事件 

B= {Xi = ki1,…, X, = k,,…, X, = k,| 
的 概率 ,只 须 考虑 &; 都 是 非 负 整数 且 如 +…+A = NN 的 情况 , 否 
则 P(B)=0. 为 计算 P(B), 从 NN 次 试验 的 原始 结果 jj,… jn 出 
发 , 它 表示 第 一 次 实验 事件 A; 发 生 , 第 二 次 试验 A; 发 生 , 等 等 . 
为 使 事件 B 发 生 , 在 7,j2,…,jn 中 应 有 ki 个 1,ks 个 2,… 等 等 . 
这 种 序列 的 数目 ,等 于 把 N 个 相 异 物体 分 成 堆 , 各 堆 依 次 有 
k1,k2，,… ,kk 件 的 不 同 分 法 . 据 第 一 章 (2.6) 式 ,不 同 分 法 有 NI / 
(k11…k,!) 个 .其 次 ,由 于 独立 性 ,利用 概率 乘法 定理 知 , 每 个 适 
合 上 述 条 件 的 原始 结果 序列 1U72…7 出 现 的 概率 ,应 为 pp 多 … 
.60 . 


ph .于 是 得 到 
_ Sp 
P(XI 一 ki1,X; k;,， ， 从) k,) = kilk; 1 - iP1 Pp2 pn 


(R 为 非 负 整数 ,kl 十 … 二 &, = NN) 
(2.3) 就 是 多 项 分 布 ,名 称 的 来 由 是 因 多 项 展开 式 


x | 
(zi 十 … 十 ra) 一 > PR (2.4) 


>， 表示 求 和 的 范围 为 :k, 为 非 负 整 数 , + … + &,， = N. 在 
(2.4) 中 令 Zi 一 pp; 并 利用 pi + 十 p; 二 1 ,得 


* NI 
2 ki11-…k TP pr 一 1 


这 说 明 分 布 (2.3) 适 合 条 件 (2.2). 

多 项 分 布 在 实用 上 颇 和 常见 ; 当 一 个 体 按 某 种 属性 分 成 几 类 时 ， 
就 会 涉及 这 个 分 布 . 例如 ,一 种 产品 分 成 一 等 品 (4i)、 二 等 品 
(A2) 三 等 品 (A3) 和 不 合格 品 (A4) 四 类 . 若 生产 该 产品 的 某 厂 ， 
其 一 二、 三 等 品 和 不 合格 品 的 比率 分 别 为 0.1$,0.70,0.10 和 
0.05, 从 该 厂 产品 中 抽出 N 个 . 若 这 六 个 只 占 其 产品 的 极 少 一 部 
分 , 则 可 以 把 这 六 个 看 成 一 个 一 个 地 独立 抽出 , 且 在 抽取 过 程 中 ， 
各 等 品 的 概率 ( 即 比率 ) 不 变 . 在 这 种 情况 下 , 若 分 别 以 XI ,…,X4 
记 这 N 个 产品 中 一 、 二 、 三 等 和 不 合格 品 的 个 数 , 则 关 = (X; ,…， 
X4) 将 有 多 项 分 布 M(N;0.15,0.70,0.10,0.05). 又 如 在 医学 上 ， 
一 种 疾病 的 患者 可 按 严重 的 程度 分 期 等 等 ,都 属于 这 种 情况 . 

如 果 ?=2, 即 只 有 Ai, A, 两 种 可 能 ,这 时 A, 就 是 A| 的 对 
立 事件 .由 于 这 时 有 Xi + X2 = N ,Xl] 唯一 地 决定 了 X， ,我 们 不 必 
同时 考虑 X1 和 X2 ,而 只 须 考虑 Xi1 就 够 了 ,这 就 回 到 二 项 分 布 的 
情形 . 


2.2.2 连续 型 随机 向 量 的 分 布 


设 X=(XI,…，,X,) 是 一 个 EA 维 随 机 向 量 .其 取 值 可 视 为 7 
四 bl . 


维 欧 氏 空间 R" 中 的 一 个 点 .如 果 X 的 全 部 取 值 能 充满 R” 中 某 一 
区 域 , 则 称 它 是 连续 型 的 . 

与 一 维 连续 型 变量 一 样 ,描述 多 维 随机 向 量 的 概率 分 布 , 最 方 
便 的 是 用 概率 密度 函数 .为 此 我 们 引进 一 个 记号 :XEA, 读 作 X 
属于 A ?或 “<X 落 在 4 内 ”, 其 中 A 是 R” 中 的 集合 . {XE Ai 是 一 
个 随机 事件 ,因为 作 了 试验 以 后 ,X 之 值 就 知道 了 ,因而 也 就 能 知 
道 它 是 否 落 在 A 内 . 

定义 2.2 若 f(x1,… ,Xx) 是 定义 在 R* 上 的 非 负 函 数 , 使 对 
R” 中 的 任何 集合 A ,有 


P(X € A)=| | f(r, za)dride, (2.5) 


则 称 f 是 X 的 (概率 ) 密 度 也 数 . 
如 果 把 A 取 成 全 空间 R”", 则 {XE 有 Aji 为 必然 事件 ,其 概率 为 
1. 因 此 应 有 


| [fCz1077 za driede, | (2.6) 


这 是 一 个 概率 密度 殴 数 必须 满足 的 条 件 . 
例 2.3 考虑 二 维 随机 向 量 X= (Xi,X2) ,其 概率 密度 函数 
为 


f(x1, zy ) 
四 1 -a)(d -cc)], 当 a<rb,cRr Rd 
lo, 其 他 处 


则 fF 非 负 且 条 件 (2.6) 满 足 .从 F 的 形状 看 出 , 它 在 图 2.6 中 那个 
矩形 之 外 为 0, 说 明 (XX| ,XX,) 只 能 取 该 矩形 内 的 点 为 值 . 在 这 和 矩形 
内 ,密度 各 处 一 样 , 因 而 全 部 概率 均匀 地 分 布 在 这 和 矩形 内 . 从 公式 
(2.5) 看 出 : 阁 集 A 在 矩形 内 , 则 “XX 落 在 A 内 ”的 概率 
P(XEA), 与 A 的 面积 成 正比 而 与 其 位 置 及 形状 无 关 , 这 是 均匀 
性 的 另 一 种 说 法 .以 此 之 故 , 人 们 把 本 例 中 X 的 分 布 称 为 上 述 矩 
形 上 的 均匀 分 布 . 

例 2.4 向 一 个 无 限 平 面 反射 击 , 设 命中 点 X= (XI|, 义 ,) 有 

. 6? . 


图 2.6 图 2.7 


概率 密度 
frysr2) = xr (1+ rit ri) 
从 这 个 隐 数 看 出 ;命中 点 的 密度 只 与 该 点 与 靶 心 的 距离 + 有 关 . 
这 可 以 解释 为 :在 图 2.7 中 以 靶 心 O 为 中 心 的 圆周 上 各 点 有 同等 
被 命中 的 机 会 . 另外 ,zf + zx 愈 小 则 fF 愈 大 ,说 明 与 脚心 接近 之 
点 , 较 之 远离 靶 心 之 点 ,有 更 大 的 命中 机 会 . 
为 验证 (2.6) 式 只 须 转 到 极 坐 标 ,得 


| fx,r2)dridzr, 
27 co 
= | dg| ni(1+r) rdr 
0 0 


= 2x， -| 0 +t) dt = 1 
而 命中 点 与 部 心 之 距离 不 超过 ro 这 个 事件 A 的 概率 为 
| zz2z)dzidza 


2 2 2 
TI] tI Sr 


2x ro 
一 | do|” r (1l+r) ?rdr = ri/(1 + r$) 
例 2.5 二 维 正 态 分 布 . 
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最 重要 的 多 维 连续 型 分 布 是 多 维 正 态 分 布 .对 二 维 的 情况 ,其 
概率 密度 郧 数 有 形式 


王 -一 一 (zl 一 a) 
f(x1, x2) = (2x010; 1 — Piem| - 5 
< (zl1 一 a)(z 一 D) (zy 一 已) 
和 (2.7) 


这 里 为 书写 方便 ,引进 了 一 个 记号 exp. 其 意义 是 :exp(c)=e.f 
中 包含 了 五 个 常数 a ,b ,ol,o5 和 p ,它们 是 这 个 分 布 的 参数 ,其 可 
取 值 的 范围 为 : 
-co<a<oc,-co<p<co>b0z >0,-]<o<1. 
常 把 这 个 分 布 记 为 Na ,pb,ci,ci,o). 这 冰 数 (在 三 维 空间 中 ) 的 
图 形 ,好 像 一 个 椭圆 切面 的 钟 倒 扣 在 Oxzizz 平面 上 ,其 中 心 在 
(a ,b) 万 . 

为 了 证 明 (2.7) 式 确实 是 一 个 密度 晒 数 ,还 须 证 明 (2.6) 式 成 
立 . 为 此 , 作 变 数 代 换 


得 


| cass) dard 


= Iv 1— P| em |- (uw — 2puv + o2) |dudy 
再 作 变 数 代 换 1 = 一 pv,t2=vV 1 p v. 注 意 到 wu 一 2puv ++v = 
(4 一 +(1 一 pp )v ==tf+ 雹 , 且 变 换 的 机 可 比 行列 式 为 


9ti/9u 9t1/9v ] 一 5 
V1 
9t2/90u Qt2/9v| |0 Vi-p 人 


缠 


| pCa)arrde, 
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=- 直 VI- Pe | -3( 1+) |dndr 


= (2x) | “ada) e822dt, 


= (2x)-!V2x V2x =1 
这 里 用 到 (1.15). 

类 似 地 可 定义 n 维 正 态 分 布 的 概率 密度 函数 ,这 里 不 细 讲 
了 . 

在 结束 这 一 段 之 前 ,让 我 们 指出 几 点 有 关 事 项 : 

1. 不 论 在 一 维 或 多 维 , 在 定义 连续 型 随机 变量 时 ,实质 之 点 
都 在 于 它 有 概率 密度 函数 他 在 ， 即 存在 有 函数 f ,满足 (1.13) 或 
(2.5) 式 .在 概率 论 理论 上 ,把 这 -- 点 直接 取 为 连续 型 随机 变量 的 
定义 : 它 就 是 有 密度 函数 的 随机 变量 .至 于 它 可 以 在 一 个 区 间或 区 
域 上 连续 取 值 倒 不 是 本 质 的 ,甚至 也 是 不 确切 的 . 

2. 与 离散 型 随机 向 量 的 定义 不 
同 ,连续 型 随机 向 量 不 能 简单 地 定义 为 
“其 各 分 量 都 是 -一 维 连续 型 随机 变量 的 
那 种 随机 向 量 ”. 举 一 个 例子 : 设 Xi 一 
R(0,1), X= X, 则 随机 回 量 
(Xi1,X2) 的 两 个 分 量 Xi ,Xs 都 是 连续 
型 的 .但 (Xi1,X2) 却 只 能 在 图 2.8 中 所 
示 的 单位 正方 形 的 对 角 线 (图 中 的 点 图 2.8 
线 ) 上 取 值 .因而 不 可 能 存在 一 个 函数 
7(ztza) 满 足 (2.6) 式 (二 元 函数 在 平面 上 任 一 线段 上 的 积分 都 
是 0), 即 (Xi,X,) 的 概率 密度 阻 数 不 存 在 . 

3. 与 一 维 情况 一 样 , 也 可 以 用 概率 分 布 函数 去 描述 多 维 随 机 
问 量 的 概率 分 布 ,其 定义 为 

F(Xxi,X2,° ,Tn) = Ce 2 ,Xn Tn) 
然而 ,在 多 维 情况 下 ,分布 函 数 极 少 应 
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2.2.3 边缘 分 布 


设 双 = (Xi,…,X,) 为 一 n 维 随机 向 量 .XX 有 一 定 的 分 布 FF， 
这 是 一 个 2 维 分 布 .因为 X 的 每 个 分 量 X; 都 是 一 维 随机 变量 , 故 
它们 都 有 各 自 的 分 布 ,i=1,…,n ,这 些 都 是 一 维 分 布 , 称 为 随 
机 向 量 X 或 其 分 布下 的 "边缘 分 布 .以 下 我 们 要 指出 :边缘 分 布 
完全 由 原 分 布下 确定 ,上 且 从 这 个 事实 的 讲解 中 也 就 悟 出 “边缘 一 
词 的 含义 . 


例 2.6 表 2.1 以 列表 的 形式 ,显示 了 一 个 二 维 随 机 向 量 X 
= (Xi,X2?) 的 概率 分 布 . 比如 
P(Xi1 = 1,X, = 5) = 0.21 

等 等 .现在 如 想 求 Xi 的 分 布 , 则 先 注意 到 , Xi 只 有 两 个 可 能 值 ， 
即 1 和 3. 而 {Xi= 二 这 个 事件 可 以 分 解 为 三 个 互 斥 事件 

{Xi = 1,X, =—-1),{X1 = 1,X> = 0|,{X, = 1,X, = 5| 
之 和 , 故 其 概率 应 为 上 述 三 事件 概率 之 和 , 即 

P(Xi = 1) = 0.17 +0.05 + 0.21 = 0.43 

类 似 地 得 P(XIi=3)=0.04+0.28+0.2S$= 0.57. 用 同样 的 方法 
确定 Xs 的 概率 分 布 为 
P(X, =-1) = 0.21,P(X, = 0) = 0.33,P(X, = 5) = 0.46 
注意 这 两 个 分 布 正好 是 表 的 中 央 部 分 的 行 和 与 列 和 .它们 都 处 在 
表 的 “边缘 ”位置 上 .由 此 得 出 边缘 分 布 这 个 名 词 . 也 有 称 为 边际 分 
布 的 . 
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从 这 个 例子 就 不 难 悟 出 ,在 一 般 的 离散 型 情况 下 ,怎样 去 求 边 
缘分 布 . 回 到 定义 2.1 的 记号 ,以 Xi 为 例 , 它 的 全 部 可 能 值 为 
aliyalzyal3…… 例 如 ,我 们 要 求 P(X = al,). 它 等 于 把 (2.1) 式 
那样 的 概率 全 加 起 来 ,但 局 限于 j! = (这 相当 于 在 上 述 简 例 2.6 
中 求 行 和 或 列 和 ). 得 

P(XI = ait) = 之 Pk ;J29° sn) k = 1,2,.. (2.8) 


例 2,7 设 XXX X, ) 服 从 多 项 分 布 M(N; pi,…， 
p;) ;要求 其 边缘 分 布 . 例如 ,考虑 Xi ,我 们 把 事件 A; 作为 一 方 ， 
A2+…+A, 作 为 一 方 ( 它 就 是 A; ) , 见 例 2.2 的 说 明 , 屠 么 ,六 | 就 
是 在 N 次 独立 试验 中 ,事件 A; 发 生 的 次 数 , 而 在 每 次 试验 中 Ai 
发 生 的 概率 保持 为 pi, 经 过 这 一 分 析 , 不 待 计算 就 可 以 明了 ;XI 
的 分 布 就 是 二 项 分 布 B(N ,pi1). 应 用 公式 (2.8) 也 可 以 得 出 这 个 
结果 : 按 (2.8) ,注意 到 多 项 分 布 的 形式 (2.3), 有 


P(X1 =&)= 2 让 人 施 … 的 “ pi/k! 
这 里 ，>, ”表示 求 和 的 范围 为 :上 ,…,& 都 是 非 负 整数 ,其 和 为 
N 一 上 . 今 | 
p2 = p2/(1 ~ p1),%, ps = pi,/(1— 
则 p23+ + pia= (ptt pa)/Al~p1)=(1-p1)/A(1- pi1)= 
1, 且 可 把 上 式 改 写 为 
PXI = A) = 2 0 
hd - p1) ~ 
按 多 项 展开 式 (2.4), 上 式 右 边 第 一 因子 为 
(p2+ +pa) “=1"*=1 
于 是 得 到 
_ 加 人 Nk 
P(X| = k) = ZION AT — p1) 
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=b(k;N, Pi),k = 0,1,…,N 
正 是 二 项 分 布 B(N ,pi1). 
现在 来 考虑 连续 型 随机 回 量 的 边缘 分 布 .为 书写 简单 计 , 先 考 
不 二 维 的 情 帝 , 设 X= (XitX2) 有 概率 密度 函数 f(z1 ,zz2). 我 们 
来 证 明 : 这 时 Xi 和 Xs 都 具有 概率 密度 消 数 . 
为 证 明 这 一 点 ,考虑 Xi 的 分 布 消 数 Fi(x1)= P(X| 志 x1). 
它 可 以 写 为 P(XI 委 zl,X2< co) .注意 到 公式 (2.5), 得 


F(x1) 一 P(X < Tl1) 一 | di Fanva)da 
| Avayada 是 ti1 的 盟 数 , 记 之 为 f(t). 于 是 上 式 可 写 为 


Fi(x1) = [ACaa 
两 边 对 z1 求 导数 ,得 到 XX| 的 概率 密度 函数 为 
dF1(x1) /dx 一 f(r1) 一 | zza)dz (2.9) 
这 不 仅 证 明了 Xi 的 密度 函数 的 存在 ,而 且 还 推出 了 其 公式 . 同 理 
求 出 Xs 的 密度 函数 为 
f(x2) = | Kaznza)dai (2.10) 
这 个 结果 很 容易 推广 到 ” 维 的 情形 : 设 X= (Xi,…,X ) 有 概率 
密度 函数 /zl，…zn) .为 求 某 分 量 X 的 慨 率 密度 函数 ,只 须 把 
大 zl ,XxX, ) 中 的 i 固定 ,然后 对 Xl Ti Titls ,Ty 在 一 
co 到 co 之 间作 定 积分 .例如 ,XX 的 密度 函数 为 
Ha 人 pases) dad, QD) 
例 2.8 再 考虑 例 2.3. 用 公式 (2.9),(2.10) 很 容易 确定 ， 
Xi1,X2 的 边缘 分 布 分 别 是 均匀 分 布 R(a ,6b5) 和 R(c,d). 计 算 很 
容易 , 留 给 读者 . 
例 2.9 考虑 例 2.4. 按 (2.9) ,Xi 的 边缘 密度 函数 为 
68 - 


fi(7x1) = x | (1 十 zf 十 如) Tdzx; 


作 变 数 代 换 上 = zy 1+ zx? ,得 
万 (rl) = (+zD22| (1 + 归 ) dz = (+ x) 3 


积分 | (1 + 如) ?di 通过 变数 代 换 1= tang 很 易 算出 . 
例 2.10 二 维 正 态 分 布 N(a,5,of,05,p) 的 边缘 分 布 密度 . 
若 (Xi,X;) 有 二 维 正 态 分 布 N(a,b,0o3,0o5,p) ,我 们 来 证 明 ;XX|， 
X, 的 边缘 分 布 分 别 是 一 维 正 态 分 布 N(a ,ci) 和 N(b,c3) .为 证 
此 ,要 计算 | ”f(z1,x2)dr2, 其 中 了 由 (2.7) 式 定义 .注意 到 


(zi 一 CD) 20(zl 一 a)Cz 一 已) . (x>— 6) 
2 2 


ol O102 O07 . 
(x1— 2) a) 人 1 uu 7 一 p 
= (1 ~“? 0) 1 + (p ol oO? 
得 到 
fi(x1) -| f(z,r2) dz = (2xc1o2V 1 一 0”)! 
(zx!1I—-a) 
op |- py jc 
其 中 


c= eon- 0 (ee) J 
作 变 数 代 换 (注意 zl 为 常数 , 非 积 分 变量 ) 
/Ve 


02 


一 ww 
机 


c=| exp(— 1*/2)dt .orV1l-po = V2xov1l-o’ 


以 此 代入 前 式 , 即 得 
由 69 . 


A _ ( 一 a) 
fi(x1) = (v 2ro1) exp| - | (2.12) 


这 正 是 N(a ,ci) 的 概率 密度 图 数 . 

从 这 个 例子 看 出 一 个 有 趣 的 事实 : 虽 则 一 个 随机 向 量 X= 
(Xi,…,X, ) 的 分 布下 足以 决定 其 任 一 分 量 X; 的 (边缘 ) 分 布 下 ， 
但 反 过 来 不 对 :即使 知道 了 所 有 X; 的 边缘 分 布 严 三 1，……,2 ,也 
不 足以 决定 X 的 分 布 天 .例如 ,考虑 两 个 二 维 正 态 分 布 

N(0,0,1,1,1/3) 和 NN(0,0,1,1,2/3) 
它们 的 任 一 边缘 分 布 都 是 标准 正 态 分 布 N(0,1), 但 这 两 个 二 维 
分 布 是 不 同 的 分 布 ,因为 p 的 数值 不 相同 . 这 个 现象 的 解释 是 : 边 
缘分 布 只 分 别 考 虑 了 单个 变量 Xi; 的 情况 ,而 未 涉及 它们 之 间 的 
关系 ,而 这 个 信息 却 是 包含 在 (Xi，……,X,) 的 分 布 之 内 的 .如 就 本 
例 来 说 ,在 下 一 章 ( 见 第 三 章 3.3 节 ) 将 指出 :o 这 个 参数 正好 刻画 
了 两 分 量 X, 和 X, 之 间 的 关系 . 

在 结束 这 一 节 之 前 ,我 们 再 强调 指出 :“ 边 缘 ” 分 布 就 是 通常 的 
分 布 ,并 无 任何 特殊 的 含义 . 如果 说 有 什么 意思 的 话 , 它 不 过 是 强 
调 了 :这 个 分 布 是 由 于 X; 作为 随机 向 量 (Xi,…,X) 之 一 分 量 ， 
从 后 者 的 分 布 中 派生 出 的 分 布 而 已 , 别 无 其 他 .至 于 “边缘 ”一 词 的 
由 来 ,已 在 例 2.6 中 解释 过 了 . 

与 此 相应 ,为 了 强调 (Xi,…,X,) 的 分 布 是 把 Xi,…，,X, 作为 
一 个 有 联系 的 整体 来 考虑 ,有 时 把 它 称 为 Xi,…,X, 的 “联合 分 
布 ”. 

万 外 ,边缘 分 布 也 可 以 不 只 是 单个 的 .例如 X= (Xi1, 久 ,XX3) 
它 的 分 布 也 决定 了 其 任 一 部 分 ,例如 (Xi ,X3) 的 二 维 分 布 ,这 也 称 
为 边缘 分 布 .有 关公 式 也 不 难 导出 ,此 处 不 细 讲 了 . 


2.3 ”条件 概率 分 布 与 随机 变量 的 独立 性 
2.3.1 条 件 概 率 分 布 的 概念 


一 个 随机 变量 或 向 量 X 的 条 件 概率 分 布 ,就 是 在 某 种 给 定 的 
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条 件 之 下 ,X 的 概率 分 布 .一 如 以 前 我 们 在 讨论 条 件 概 率 时 所 指 
出 的 ,任何 事件 的 概率 都 是 有 条 件 的 , 即 与 这 事件 联系 着 的 试验 
的 条 件 ,如 货 子 是 均匀 的 立方 体 且 抛掷 的 高 度 是 足够 大 之 类 . 以 
此 ,任何 随机 变量 或 向 量 的 分 布 ,也 无 不 是 在 一 定 条 件 下 .但 此 处 
所 谈 的 条 件 分 布 ,是 在 试验 中 所 规定 的 “基本 "条 件 之 外 再 附加 的 
条 件 . 它 一 般 采 取 如 下 的 形式 : 设 有 两 个 随机 变量 或 向 量 X,Y, 在 
给 定 了 Y 取 某 个 或 某 些 值 的 条 件 下 ,去 求 X 的 条 件 分 布 . 

例如 ,考虑 一 大 群 人 ,从 其 中 随机 抽取 一 个 ,分 别 以 XI 和 XX， 
记 其 体重 和 身高 , 则 Xi , XX, 都 是 随机 变量 ,它们 都 有 一 定 的 概率 
分 布 .现在 如 限制 1.7 三 X, 记 1.8( 米 ), 在 这 个 条 件 下 去 求 Xi 的 
条 件 分 布 ,这 就 意味 着 要 从 这 一 大 群 人 中 把 其 身高 在 1.7 米 和 
1.8 米 的 那些 人 都 挑 出 来 ,然后 在 挑 出 的 人 群 中 求 其 体重 的 分 布 . 
容易 想像 ,这 个 分 布 与 不 设 这 个 条 件 的 分 布 (无 条 件 分 布 ) 会 很 不 
一 样 .例如 ,在 条 件 分 布 中 体重 取 大 值 的 概率 会 显著 增加 . 

从 这 个 例子 也 看 出 条 件 分 布 这 个 概念 的 重要 性 .在 本 例 中 ,和 弄 
请 了 Xi 的 条 件 分 布 随 X, 之 值 而 变化 的 情况 ,就 能 了 解 身高 对 体 
重 的 影响 在 数量 上 的 表述 . 由 于 在 许多 问题 中 有 关 的 变量 往往 是 
彼此 有 影响 的 ,这 使 条 件 分 布 成 为 研究 变量 之 间 的 相依 关系 的 一 
个 有 力 工 具 . 这 一 点 以 后 在 第 六 章 中 还 要 作 更 深入 的 发 挥 . 


2.3.2 离散 型 随机 变量 的 条 件 概 率 分 布 


这 个 情 次 比较 简单 ,实际 上 无 非 是 第 一 章 讲 过 的 条 件 概率 概 
念 在 为 一 种 形式 下 的 重复 . 设 (X1,X;) 为 一 个 二 维 离散 型 随机 向 
量 ,X 的 全 部 可 能 值 为 a ,as,…;X 的 全 部 可 能 值 为 51,5,，,…， 
而 (Xi ,XX;) 的 联合 概率 分 布 为 

p; = P(X! = a;,X> = bi),i,7 = 1;2,… 
现 考虑 Xi 在 给 定 X,=。; 的 条 件 下 的 条 件 分 布 , 那 无 非 是 要 找 条 
件 概率 P(XI=a|X,= 6。;). 依 条 件 概 率 的 定义 ,有 
P(XI =a; | X, = b;) = PLXI = a;,X> = b;)/P(X, = b;) 
= pi; /P(X, = b;) 
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再 据 公式 (2.8)(n = 2 的 情况 ), 有 P(X， = 6b;) = >) 四: 于 是 
P(Xi1 = al = 6) = pj/ Dpysi = 12… (3.1) 
类 似 地 有 
P(X, = b; [Xi1 = ai) = py/ pis = 1,2,… (3.2) 
例 3.1 再 考虑 例 2.6. 据 公式 (3.1) 和 (3.2), 不 难 算出 在 给 
定 Xs 时 Xi 的 条 件 分 布 ,与 给 定 Xi 时 X, 的 条 件 分 布 .例如 ,在 
P(X| = 3|X, = 0) = 0.28/0.33 = 28/33 
例 3.2 设 (Xi,XX2,…,X,) 服 从 多 项 分 布 M(N; pi,… 
Pn) . 试 求 在 给 定 XX, 二, 的 条 件 下 ,Xi 的 条 件 分 布 . 
先 计 算 概 率 P(X1=k&,, X; 二,). 这 里 假定 ki, Rk’ 都 是 非 负 
整数 ,日 | 过 N 一 上 &. 按 (2.3) 式 ,有 


一 Vv NN! kk .pk 
P(X 一 ki1,X, 一 k,) 一 了 kilks lksl-k Pt P2P3 pr 


这 里 >)” 表示 求 和 的 范围 为 3,…,k, 都 是 非 负 整数 ,日 &s+ 


ky 


+k,=N- (ki+k,). 令 pi= pi/A(1 一 pi 一 p;),i1 之 3, 有 


NI! 
P(Xi = ki,X2 = &2) = RIIRICN RI ks)! 


" pi 1ps2(1 pi1— p2) kk 
其 中 


(N k 到 )! z ” 
C= 


由 于 ps+ pl 考虑 到 上 式 求 和 的 范围 及 多 项 展开 式 
(2.4), 即 知 C- 1, 因 此 
P(X 一 ki,X, 一 k,) 
一 NI 。 k 天 (1 )N-& _k 
kilks(N— kl—k,)! pup> P1 一 疡 2 1 2 
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再 根据 例 2.7,X, 的 分 布 就 是 二 项 分 布 B(N， p2). 因 此 
P(X, 一 ki| X， = k») 
= P(X 一 ki1,X2 = 一 &>)AP(CX， 一 k2) 


) Nk 


Np 
-EIEION REID pl pl p? 
| - 
/EN Ri 一 p2) 
CN / pl p1 V1 
kil(N 一 Ri 一 fi 一 阿 ( ~“ 1- 阿 
= DRIIN - k2,p1/(1 — 思 )) = 0,1,.…,N — k, 
由 此 可 知 :在 给 定 X= &, 的 条 件 下 ,Xi 的 条 件 分 布 就 是 分 布 
B(N-k,,p1/(1 ~ po)). 


2.3.3 连续 型 随机 变量 的 条 件 分 布 


设 二 维 随机 向 量 X =(Xi,X:) 有 概率 密度 函数 f(z, zz) 
我 们 先 来 考虑 在 限定 a 委 z 委 2 的 条 件 下 ,Xi 的 条 件 分 布 . 有 
P(X 人 rila Xo) 
=P(X! xi,a XRb)/P(a Xb) 
Xs 的 边缘 分 布 的 密度 困 数 户 由 (2.10) 给 出 .有 
P(X < ri,a ZX, Cb) 


-| ”4 dn| A ti,t2)dt, 


P(ae 委 X 委 0)= | fid 


由 此 得 到 
PLXI 委 zllc 委 XXX 委 0) 
一 上 dj Fer) | Pear 
这 是 Xi 的 条 件 分 布 函数 .对 zl 求 导 数 , 得 到 条 件 密度 图 数 为 
fi(xilaX, 6)= | frst2)g1)| fle2)de (3.3) 


。 73 。 


更 有 兴趣 的 是 w=2 的 情况 , 即 在 X, 给 定 等 于 一 个 值 之 下 ， 
X| 的 条 件 密度 函数 . 这 不 能 通过 直接 在 (3.3) 中 令 a = 得 出 ,但 
可 用 极限 步 又， 
filril x2) = fi(xil X> = 工 2 ) 
=limfi(xilz2 < X2 < r+ h) 


| f(xi,t2) dt 四 二 fo(t2)dt, 


= f(zxi,T2)/f2( x2) (3.4) 
这 就 是 在 给 定 X= x 的 条 件 下 ,Xi 的 条 件 密度 函数 . 此 式 当 然 
只 有 在 fa(x2) >>0 时 才 有 意义 .在 上 述 取 极限 的 过 程 中 ,还 得 假 
定 函 数 f, 在 x 点 连续 ,及 f(xi,t;) 作 为 1, 的 消 数 ,在 1,= xz 处 
连续 .然而 ,用 高 等 概率 论 的 知识 ,可 以 在 没有 这 种 连续 的 假定 下 
证 明 (3.4). 
(3.4) 式 可 改写 为 
ALzlz2) = far2)filxril x) (3.5) 
就 是 说 :两 个 随机 变量 Xi 和 X, 联合 概率 密度 ,等 于 其 中 之 一 的 
概率 密度 乘 以 在 给 定 这 一 个 之 下 另 一 个 的 条 件 概 率 密 度 . 这 个 公 
式 相 应 于 条 件 概率 的 公式 P(AB)= P(B)P(A1B). 除 (3.5) 外 ， 
当然 也 有 


-lim 工 
h=0 hh 


f(xi,T2) = fi(zx1) fo( x2| zi) (3.6) 
其 中 fi 为 zi 的 边缘 密度 ,而 
fax2l zx1) = f(xi, xr2) /fi(x1) (3.7) 


则 是 在 给 定 Xi = zi 的 条 件 下 ,X, 的 条 件 密度 . 这 些 公 式 反 映 的 
实质 可 推广 到 任意 多 个 变量 的 场合 : 设 有 n 维 随机 疝 量 (Xi ,… 
X, ) ,其 概率 密度 函数 为 f(xz1,… ,zz; ). 则 
大 zl rx,) 一 A 
. (3.8) 
其 中 g 是 (XX ,… ,Xi) 的 概率 密度 ,而 h 则 是 在 给 定 Xi = zl ,… 
Xi 二 Xs 的 条 件 下 ,Xi+1,…,X, 的 条 件 概率 密度 . (3.8) 可 视 为 
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(3.6) 的 直接 推广 ,又 可 视 为 户 (zeri ,Xn1X1 zy) 的 定义 ， 
例 3.3 设 (X1,X,) 服 从 二 维 正 态 分 布 N(a ,bci,cs,o). 
求 在 给 定 Xi == zi 的 条 件 下 ,X, 的 条 件 密度 函数 f(x2| zx!1). 
利用 公式 (3.7),(2.7) 和 (2.12), 经 过 简单 的 计算 ,得 出 
f(x2|z1) =- 一 一 
V2ray V ] 一 0 


(Z2 一 (8 十 pr201 (zi 一 2 
2(1 — p*)o3 


。 exp| 一 
(3.9) 
这 正 是 正 态 分 布 N(b+ po2o1 (Xx1 一 a),o3(1 一 p*)) 的 概率 密度 
晒 数 (注意 在 (3.9) 式 中 ,zl 当 常 数 看 ). 因 此, 正 态 变量 的 条 件 分 
布 仍 为 正 态 ,这 是 正 态 分 布 的 一 个 重要 性 质 . 
如 我 们 在 图 2.22 中 所 显示 的 , 正 态 分 布 N(yy,o”) 关 于 jp 点 - 
对 称 ,y 就 是 分 布 的 中 心 位 置 ,对 正 态 分 布 (3.9), 这 个 中 心 位 置 在 
m(z1) = b+ p0201 (Xx1 — a) (3.10) 
处 ,由 这 里 可 以 看 出 o 刻画 了 Xi,X; 之 间 的 相依 关系 .其 解释 如 
下 :各 o>0, 则 随 着 zl 的 增加 ,X2( 在 Xi =x 之 下 ) 的 条 件 分 布 
的 中 心 点 m (zi) 随 zi 的 增加 而 增加 .可 以 看 出 :这 意味 着 当 zi 
增加 时 ,X, 取 大 值 的 可 能 性 增加 , 即 X 有 随 着 Xi 的 增长 而 增长 
的 倾 铝 (如 体重 与 身高 的 关系 那样 ). 反 之 ,车 o<0, 则 X, 有 随 着 
X1 增长 而 下 降 的 倾向 . 由 于 这 个 原因 ,通常 把 o>0 的 情况 称 为 
“ 正 相 关 ,而 o<0 的 情况 称 为 “ 负 相 关 ”. 这 一 点 在 下 一 章 中 还 要 
谈 到 . 
把 (3.5) 两 边 对 z 积分 ,得 


f(z) =| fra)dr = | PCzilza) 户 (za)dza 


(3.11) 

这 个 公式 可 解释 为 :Xi 的 无 条 件 密度 f1(x1), 是 其 条 件 密度 _ 户 

(zijlz2) 对 “条件 zz 的 平均 .更 确切 地 说 ,是 按 其 概率 大 小 为 权 的 

加 权 平 均 ， 因为 , f2 (X27) dr 正 是 入 ?> 在 2 附近 dz> 这 么 长 的 区 
a 了 7 . 


闻 内 的 概率 .从 直观 上 看 这 应 当 是 很 自然 的 .比如 说 ,(Xi,X2;) 代 
表 一 大 群 人 中 随机 抽出 的 一 个 人 的 体重 和 身长 , XX (体重 ) 有 其 
(无 条 件 ) 分 布 ,这 可 以 看 作为 各 种 不 同 的 身高 综合 之 后 所 呈现 的 
分 布 ,而 不 同 于 固定 身长 X; = xs 时 的 条 件 分 布 .但 把 各 种 身长 时 
体重 的 条 件 分 布 进行 平均 ,也 就 实现 了 上 述 综合 , 即 得 到 无 条 件 分 
布 . 公 式 (3.11) 正 好 从 数学 上 反 瞻 了 这 种 综合 (或 平均 ) 的 过 程 . 

还 要 注意 :公式 (3.11) 也 可 以 看 作 是 全 概率 公式 (第 一 章 ) 
(3.17) 在 概率 密度 这 种 情况 下 的 表现 形式 .在 这 里 , fi(x1) 相 当 
于 全 概率 公式 中 的 P(A), fi(zilzx;) 相 当 于 条 件 概率 P(AiB,)， 
而 (3.11) 中 的 积分 ,正好 相当 于 (3.17) 式 中 的 以 P(B,) 为 权 的 加 
， 权 和 . 

由 此 可 见 , 在 学习 概率 论 时 ,不 能 光 是 形式 地 看 待 --- 些 分 析 公 
式 , 更 重要 的 是 要 分 析 其 概率 意义 及 直观 意义 ,这 样 才能 加 深 理 
解 . 上述 对 公式 (3.11) 的 分 析 是 一 个 例子 .再 如 ,在 例 3.3 中 我 们 
用 形式 推导 很 容易 得 出 了 条 件 密度 (3.9) 式 .只 看 这 形式 推导 ,你 
可 能 地 觉得 这 里 没有 什么 特别 值得 注意 的 地 方 . 但 经 过 分 析 
(3.10) 式 中 po 的 作用 ,再 辅 之 以 体重 身高 这 个 实例 ,我 们 就 领悟 
到 了 p 作为 刻画 二 者 的 相依 性 的 作用 ,理解 就 深 一 层 了 .在 下 一 
草 中 我 们 还 要 进一步 讨论 (3.9) 所 反映 出 的 其 他 概率 含义 . 


2.3.4 随机 变量 的 独立 性 


先 考虑 两 个 变量 Xi, X: 的 情况 ,并 设 (X|,X,) 为 连续 型 .如 
前 ,分 别 以 fxisT2), fix1) ,fa x3), fi(ri|r2), f(r2lri)ic 
联合 ,边缘 与 条 件 概 率 密度 . 

一 般 , 广 (zlilzz) 是 随 zz 的 变化 而 变化 的 ,这 反映 了 Xi 与 
X2 在 概率 上 有 相依 关系 的 事实 , 即 Xi 的 (条 件 ) 分 布 如 何 ,取决 
于 万 一 变量 之 值 . 

如 果 用 (x1|z2) 不 依赖 于 rz, 因而 只 是 zi 的 函数 , 暂 记 为 
g《X1), 则 表示 XX 的 分 布 情况 与 X, 取 什 么 值 完 全 无 关 , 这 时 就 
称 Xi,X: 这 两 个 随机 变量 (在 概率 论 意义 上 ) 独 立 .这 概念 与 事件 

。76 ， 


独立 的 概念 完全 相似 . 
把 fi1(zi|zx2)= 二 g(xi1) 代 入 (3.11), 得 


fi(zx1) -| g(x)fa(r2)dz 


=g(z)| falz2)dz, 


= g(x1) 
因此 ,Xi 的 无 条 件 密度 fi (x1), 就 等 于 其 条 件 密度 fi (xi|x;)， 
这 也 可 取 为 独立 性 的 定义 . 
再 次 ,把 fi(x1)= 六 (| x2) 代 和 人 (3.5), 得 
flxri,x2) = fi(x1) fo x2) (3.12) 
项 (Xi,X2) 的 联合 密度 ,等 于 其 各 分 量 的 密度 之 积 .这 也 可 取 作 为 
Xi1,X2 独立 的 定义 (此 式 相 应 于 第 一 章 (3.7) 式 ), 比 之 上 述 定义 ， 
它 有 其 优越 性 :一 是 其 形式 关于 两 个 变量 对 称 , 二 是 它 总 有 意义 ， 
而 在 用 条 件 密度 去 定义 时 ,可 能 碰 到 条 件 密度 在 个 别 点 无 法 定义 
(分 母 为 0) 的 情况 . 
这 个 形式 的 为 一 个 好 处 是 它 可 以 直接 推广 到 任意 多 个 变量 的 
情形 .我 们 就 把 它 取 为 一 般 情况 下 的 正式 定义 : 
定义 3.1 设 n 维 随机 向 量 (X,…,X, ) 的 联合 密度 函数 为 
f(x1，…,Xn); 而 X; 的 (边缘 ) 密 度 消 数 为 f(x;),i = 二 1,…,n. 如 
用 
ZI Zi = 万 (ZiD) 太 (Zn) (3.13) 
就 称 随机 变量 X1,…,X, 相互 独立 或 简称 独立 . 
变量 独立 性 的 概念 还 可 以 从 另外 的 角度 去 考察 . 按 前 面 的 分 
析 , 它 含 有 这 种 意思 :如 果 Xi,…,X, 独立 , 则 各 变量 取 值 的 概率 
如 何 , 毫 不 受 其 他 变量 之 影响 ,因此 , 若 考 察 2 个 事件 
Al= ja 委 X 委 64 = la, < X, Sb,| 
(3.14) 
则 因 各 事件 只 涉及 一 个 变量 ,它们 应 当 是 相互 独立 的 事件 ,我 们 可 
以 把 这 个 要 求 取 为 变量 XX ,…,X 独立 的 定义 .下 面 的 定理 证 明 ， 
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这 与 定义 3.1 是 等 价 的 , 即 同一 件 事 的 两 种 不 同 的 说 法 . 

定理 3.1 如 果 连 续 变量 Xi,…,X 独立 时 , 则 对 任何 ai< 
bi 二 1,…,7 ,由 (3.14) 定 义 的 个 事件 Al,…,A, 也 独立 . 

反之 , 若 对 任何 wC < oz=1,…,72 ,事件 Ap…A， 独立 , 则 
变量 Xi,……,X, 也 独立 . 

证 先 设 X11,…,X, 独立 ,因而 (3.13) 成 立 . 为 证 事件 Ai， 
…,A, 独立, 按 第 一 章 定 义 3.3, 必须 对 任何 1 ,…,i, (1 二 i1<< 
放 芝 < 侵 记 全 7 ) 去 证 明 

P(A; A;*…A; ) = P(A; )P(A; )…P(A; ) 
为 书写 简单 计 ,我 们 对 i =1, 志 = 二 2,…,i% = m 来 证 此 式 , 这 不 影 
响 普 遍 性 . 按 联合 分 布 密度 的 定义 (2.5) 式 ,有 
P(A1A2*…A,) 
= Plal < Xi Sb, an SX S bn) 
Plail< Xi bi an SX, Tb,, 
-OO<X 人 < ,< X, < oo) 


ea 


| eh) de 


| 


|| 


=- | f(z)dzr,| falz)drnn| 六 (Cr ydzr 


x | “fxm ) dr 


| fa )dzi "faz ) dx, 


= Pal 委 XI 和 0) Pa < X, Sb,) 
这 证 明了 所 要 的 结果 . 
另 一 方面 , 若 对 任何 a; 达 6;,i=1,…,n,(3.14) 中 的 2 个 事 
件 独立 , 则 取 4; = | 一 co<X 委 zi 人 =1,…,72 ,由 
由 78 . 


P(AIA>…A，) 一 P(AT)P(A PC(A，) 
即 得 
| | 本 frst ,ty dt dt 


WA ZE dt fi )dii 


上 式 两 边 依次 对 zi ,zz ,…,X, 取 偏 导数 ( 即 作 90” /| Ay… 红 , )， 
即 得 (3.13) 式 ,因而 证 明了 Xi,…,X, 独立 . 

下 面 再 提出 两 个 有 关 独 立 性 的 有 用 的 结 琳 . 

定理 3.2 大 连续 型 随机 向 量 (X|,…,X,; ) 的 概率 密度 浮 数 
f(x1，,…,Xi) 可 表 为 个 函数 gg ,…,g, 之 积 ,其 中 g; 只 依赖 于 
x;,Bh 

f (xi 一 g1(TI) gn (Tn) (3.15) 

则 XX ,…, 久 , 相互 独立 , 且 X; 的 边缘 密度 也 数 f.(x;) 与 g(x;) 只 
相差 一 个 常数 因子 . 

证 按 (2.11) 式 , 知 Xi 的 密度 函数 为 


万 (zl) =| | fl ,X29 Ta ) dro" dr 


一 gil(zD| aa(za)dz| (mn)dm 一 Clg1(X1) 


其 中 Ci 为 常数 . 同 法 证 明 X; 的 密度 函数 Cg (zx;). 

因此 gj(z;)= C7 1f;(z;), 其 中 f; 是 zx; 的 密度 函数 .以 此 代 
入 (3.15), 知 f(zxr1,*, Ta) = Cr C2 Ci f(x) f(z, ). 
此 式 两 边 对 zi, …，,zn 的 积分 都 为 1、 知 Cr'C>!…Ci 1!=1, 因 而 
fr Tn) 三 用 (X12) 一 所 (xr). 按 定 义 (3.1), 知 XX,…,X, 独 
立 . 

定理 3.3 若 Xi,……X, 相互 独立 ,而 

YI = SICXI，…，Xn) Ya = go Xl Xn) 

旭 Yl 和 Y， 独立 . 

这 个 定理 直观 上 的 意义 很 明白 :因为 XX ,…,X, 相互 独立 ,把 
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它 分 成 两 部 分 Xi ,Xm 及 X,+1，,"…，, 义 ,, 一 者 没有 关系 . 因为 
Yi1, Y: 分 别 只 与 前 者 和 后 者 有 关 , 它 们 之 间 也 不 应 有 相依 关系 . 
证 明细 节 也 不 难 写 出 ,在 此 从 略 了 . 

以 上 讨论 的 是 关于 连续 型 变量 的 独立 性 ,至 于 离散 型 则 更 为 
简单 . 

定义 3.2 设 X1,…,X, 都 是 离散 型 随机 变量 .和 在 对 任何 第 
数 a ,…,a, ,都 有 

P(X! = a1,°**, X, = a,) = P(X! = a1)**…P(X, = a,) 
则 称 Xi ,…, XX, 相互 独立 . 

所 有 关于 独立 性 的 定理 ,如 定理 3.1 一 3.3, 全 都 通用 于 离散 
型 .唯一 的 变动 是 :凡是 在 这 些 定 理 中 提 到 ”密度 函数 "的 地 方 , 现 
在 要 改 为 "概率 冰 数 ”. 

例 3.4 设 (Xi,X?) 服 从 二 维 正 态 分 布 NCa ,bai,as,o). 
由 其 联合 密度 函数 F(zi,zz) 的 形式 (2.7) 看 出 : 当 且 仅 当 oe=0 
时 ,f(x1,X2) 才 可 以 表 为 两 个 边缘 密度 方 (z1) 和 p(xz;) 之 积 . 因 
此 , 当 且 仅 当 e=0 时 ,Xi 和 X; 独立 .这 进一步 反映 了 我 们 以 前 
提 及 的 一 点 事实 :po 这 个 参数 与 X1,X, 的 相依 性 有 关 . 

例 3.5 考虑 例 2.4 的 随机 向 量 (Xi,X;). 据 例 2.9 的 结果 ， 
不 难 知道 :Xi,X; 不 为 独立 . 

与 事件 的 独立 性 一 样 ,在 实际 问题 中 ,变量 的 独立 性 往往 不 是 
从 其 数学 定义 去 验证 出 来 的 .相反 , 常 是 从 变量 产生 的 实际 背景 判 
断 它 们 独立 (或 者 其 相依 性 很 微弱 因而 可 近似 地 认为 是 独立 ) , 然 
后 再 使 用 独立 性 定义 中 所 赋予 的 性 质 和 独立 性 的 有 关 定 理 .例如 ， 
一 城市 中 两 个 相距 较 远 的 路 段 在 一 定时 间 内 各 自发 生 的 交通 事故 
数 , 一 个 人 的 姓氏 笔划 与 其 智商 . 在 实际 中 ,nn 个 变量 XX ,…, XX， 
的 独立 性 通常 是 这 样 产生 的 :有 ?2 个 彼此 无 关联 的 试验 玉 ) ,…， 
已 ,而 X; 只 依赖 于 试验 五 ; 的 结果 .形式 上 我 们 可 以 构 作 一 个 复 
合 试验 巨 = (Fi1,…, 忆 ,), 以 把 这 n 个 变量 都 包容 在 这 个 试验 下 
之 下 .这 种 观点 在 讲 事件 独立 性 时 已 提 到 过 了 . 

然而 ,在 主要 是 理论 的 情况 下 ,需要 直接 借助 于 定义 来 验证 变 
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量 的 独立 性 . 举 -一 个 例子 . 

例 3.6 设 Xi,X, 独立 ,都 服 
从 标准 正 态 分 布 N (0,1). 把 点 
(Xi,X2 ) 的 极 坐 标记 为 (R，, 9)， 
0 有 R<co,0 过 9<2r. 求 证 :R 和 
9 独立 (图 2.9). 

取 定 ro>0,0< 9 <2r. 考 虑 
事件 B= 10 过 Rro,0 达 6 世 901. 
由 于 Xi,X， 独立 且 各 自 的 密度 级 
数 分 别 为 V2 ee- 2 和 Ww 23x 
e- 2, 由 独立 性 定义 3.1 知 


(Xi ,X2) 的 联合 密度 为 (2r) -iexp( 一 也 (x? + zx3) ). 因此 , 按 密 
度 函数 的 定义 (2.5) 式 ,有 
P(B) = | Qa) lexp[ -3 (z+ x2) ]dzidzs 
化 为 极 坐 标 ,得 
PlOO<REr0<0<0)= Cz) | e ardrdl 


图 2.9 


由 这 个 等 式 直接 看 出 :(R ,@) 的 概率 密度 函数 就 是 (2x) -le- ”2r 
( 当 0 委 r<oo,0 委 9<2r, 其 他 处 为 0). 它 是 下 述 两 个 函数 的 乘 
积 : 


一 > ~ 
e ”<*r, 当 rr 衬 0 
fi(r) -1 -二 一 一 


0， 当 r><0 
12xr;0 雪 9<2x 
人 -| 
f20) 10， 当 他 6 


按 定 理 3.2, 即 得 知 尺 与 8 独立 , 且 R 与 9 的 密度 也 数 分 别 是 
fi(r) 和 和 f(0). 
离散 型 变量 独立 性 的 一 个 重要 例子 涉及 事件 独立 性 与 随机 变 
. S31] 由 


量 独立 性 之 间 的 关系 . 

鲍 3.7 设 有 7 个 事件 Al,A,,…,A,. 针对 每 个 事件 A;, 
定义 一 随机 变量 X; 如 下 : 

X; = 1, 当 事件 A 发 生 ; X; = 0, 当 A 不 发 生 (3.16) 
常 把 X; 称 为 事件 A 的 指示 变量 或 指示 纯 数 、 示 性 图 数 (indica- 
tor) ,意思 是 其 值 指示 ”了 A 是 否 发 生 .这 个 写法 表明 :事件 可 视 
作 随 机 变量 的 一 种 特例 . 

不 难 证 明 ;: 寿 事件 A1,…,A, 独立 , 则 其 指示 变量 XI，…X， 
独立 .反之 亦 成 立 .证 明 是 基于 第 一 章 的 系 3.3, 我 们 把 细节 留 给 
读者 自己 去 完成 . 

利用 指示 变量 的 概念 ,可 以 对 第 一 章 系 3.2 后 面 那 段 话 作出 
统一 而 简洁 的 论证 .者 事件 A1,…, A 独立 ,而 事件 Bi 取决 于 
Al,…,A%( 这 意思 是 说 :一 旦 知道 了 事件 A1,…,A,, 中 每 一 个 发 
生 与 否 ,就 能 定 下 Bi 发 生 与 否 ), 事 件 Bs 取决 于 A 411,…, A,， 
则 Bl 与 B, 独立 . 转 到 指示 变量 :分 别 以 Xi,…,X, 记 Al,…,A, 
的 指示 变量 ,以 Y 和 Y, 分 别 记 Bl 和 B, 的 指示 变量 . 按 假定 ， 
后 者 分 别 是 XX ,…, XX,, 与 处,,+1,… ,XX, 的 函数 : 

Y= SICXI Kn), Y2 = go X11 , Kn) 
由 Al1,…,A; 独立 知 随机 变量 Xi,……,X, 独立 .再 据 定理 3.3, 即 
知 Yi 与 Y> 独立 ,因而 事件 Bl 和 B, 独立 . 

例 3.8 设 (X1,…,X,) 服 从 多 项 分 布 M(N; pi,…,p,)， 
六 >0,=1 ,1. 对 任何 关 v ,X, 和 XX, 不 独立 . 

这 个 结论 从 直观 上 看 至 为 明显 : 按 多 项 分 布 的 定义 有 XX 二 … 
+Xa=N. 生 ?2>2, 则 虽然 X, 并 不 足以 唯一 决定 X,, 但 二 者 有 
关 . 例 如 , 当 X, 取 很 大 的 值 时, X, 取 大 值 的 可 能 性 就 降低 . 这 说 
明 ;X, 在 给 定 X, 之 下 的 条 件 分 布 ,取决 于 X, 的 给 定 值 ,因而 不 
符合 独立 性 的 要 求 .形式 的 证 明 也 不 难 作出 , 留 给 读者 去 完成 . 


2.4 随机 变量 的 函数 的 概率 分 布 


在 理论 和 应 用 上 ,经 常 磁 到 这 种 情况 :已 知 某 个 或 某 些 随 机 变 
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量 Xi …,X， 的 分 布 , 现 另 有 一 些 跑 机 变量 Yi ……, Y ,它们 都 是 
Xi，…,X， 的 函数 : 
Y; = gi(X1, XXX) (4.1) 

要 求 (Y1,… ,YY,,) 的 概率 分 布 .事实 上 我 们 已 经 考虑 过 这 样 的 一 
个 例子 , 即 例 3.6. 

在 数理 统计 学 中 常 碰 到 这 个 问题 .在 那里 ,XU……X, 是 原始 
的 观察 或 试验 数据 , Y|,…, Y,, 则 是 为 某 种 目的 将 这 些 数据 "加 
工 而 得 的 量 , 称 为 “统计 量 ”. 例 如 ,Xi，……X, 可 能 是 对 某 个 未 知 
量 a 作 ? 次 量 测 的 结果 , 量 测 有 误差 ,我 们 决定 用 Xi ,…,X, 的 算 
术 平 均值 X=(XI+…+X,)Aa 去 估计 未 知 量 a.X 就 是 X1,…， 
X， 的 图 数 ， 


2.4.1 离散 型 分 布 的 情况 


这 种 情况 比较 简单 , 故 只 须 稍 加 解释 .例如 ,变量 X 取 6 个 值 
-2, 一 1,0,1,2,3, 其 概率 分 别 为 1/12,3/12,3/12,2/12,1/12 和 
2/12, 而 Y=X3. 则 Y 取 8, 一 1,0,1,8,27 这 6 个 值 ,它们 没有 
相 重 的 , 故 取 这 些 值 的 概率 ,就 仍 如 上 述 . 

但 若 考虑 Y = X*, 则 情况 有 所 不 同 .相应 于 X 的 6 个 值 的 Y 
值 分 别 为 4,1,0,1,4,9, 其 中 有 相 重 的 . 相 重 值 的 概率 需要 合并 起 
来 : 
P(Y=0) = P(X = 0) = 3/12 
Pl(Y=1)= P(X = 1)+ P(X=-1)= 2/12+3/12 = 5/12 
Pl(Y =4) = P(X = 2)+ P(X =-2) = 1/42+ 1/2 = 2/12 
P(Y = 9)= P(X = 3) = 2/12 
一 般 情 况 在 原则 上 也 一 样 :把 Y=g(Xi,…,X, ) 可 以 取 的 不 同 值 
找 出 来 ,把 与 某 个 值 相应 的 全 部 (X11,…,X, ) 值 的 概率 加 起 来 , 即 
得 Y 取 这 个 值 的 概率 . 当然 ,在 实际 做 的 时 候 ,涉及 的 计算 也 可 能 
并 不 简单 . 

例 4.1 设 (Xi,X;,…,XX, ) 服 从 多 项 分 布 M (N;p!,…， 
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力 ) ,7 之 3. 试 求 Y=X) 十 义 > 的 分 布 . 


Y 取 值 为 0,1,…,N. 指 定 &, 有 
， N|! 
P(Y = k) 一 > Epi Tih pp ph 
这 里 >， 表示 求 和 的 范围 为 
有 为 非 负 整数 ,Ri TAR = ,ki1+…+k ==NN 
记 p;= pA1-— pi Pp2) ,1 =3,. ,7 , 则 ps3t+… 十 p= 二 1. 将 上 式 


P(Y = &) NI — pi1— p23) 二 多 二 用 放 
5” A ps “pi 

这 里 中 来 和 的 苍 国 及 hi 为 非 负 整数 ,kl + &2 = 上. > J” 求 

和 的 范围 为 ;k3,… ,kk, 为 非 负 整数 ,ks 十 … 十 有, = N 一 上 .由 于 

p33+… 二 p= 1 由 (2.4) 式 知 > ”这 个 和 的 值 是 1. > 这 个 和 

的 值 为 (pl + p，)“. 于 是 得 到 : 


P(Y = &) = ED! 十 p2) [1 — (pit+ p2)) « 


=b(k;N,p1 + p2) 

即 Y 服从 二 项 分 布 B(N ,pi+ p2). 

如 果 从 概率 意义 的 角度 去 考虑 ,这 个 结果 不 用 计算 就 可 以 知 
道 :在 定义 多 项 分 布 时 有 7 个 事件 Ai, As, A;,…, A,. Xi1, XX2， 
X3,…,X, 分 别 是 它们 在 NN 次 试验 中 发 生 的 次 数 . 现 若 记 A = Ai 
+ A2, 则 事件 A ,A3,… ,A, 仍 构成 一 个 完备 事件 群 ,其 概率 分 别 
为 pi+ pz,p3… ,pai: 记 了 = 二 X1 ++X;, 则 (YY, 针 3,… ,XX, ) 构 成 多 
项 分 布 M(N;prt p2,p3，…,pn), 而 Y 成 为 这 个 多 项 分 布 的 一 
个 边缘 分 布 .于 是 按 例 2.7 即 得 出 上 述 结论 . 

这 就 是 我 们 前 面 几 个 地 方 曾 提 及 的 概率 思维 .概率 论 中 有 不 
少 结果 可 以 用 纯 分 析 方 法 证 明 , 但 如 利用 概率 思维 ,有 时 证 明 可 以 
简化 ,学 习 概 率 论 的 一 个 要 素 在 于 锻炼 这 种 概率 思维 . 
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例 4.2 设 XI 和 义 , 独立, 分别 服 从 二 项 分 布 Bl(n1,p) 和 B 
(nn3, 力 )( 注 意 p 是 公共 的 ), 求 Y= Xi + 的 分 布 . 
Y 之 可 能 值 为 0,1,…, ni ++n2. 固定 上 于 上 述 范 围 内 ,由 独 
立 性 假定 ,有 
P(Y=k)= >) P(X1= ki, X=&k,) 


SY nl pei(1 — pp) | pa(1 p) mh 
ki ko | 


= 之 WI EA 
Rk; 


i 
此 处 3)“ 求 和 的 范围 为 :k1,&2 为 非 负 整 数 ,kl + 有 2 = 上. 按 第 一 


12 7 711 十 7 
#22.5).9D (| ， 中 
1 2 1 


十 . 
Pr= 人 k pb kim n2,p) 


即 Y 服从 二 项 分 布 B(ny+ ns,P). 这 个 结果 很 容易 推广 到 多 个 
的 情形 : 若 X, 一 BUDD 方 ) 三 1 yn, 而 X11, 入 独立 , 则 Xi 
+…+X 一 BOzi+…+7) 力 ). 证 明 不 难 用 归纳 法 作出 ,细节 留 
给 读者 . 

上 述 结论 如 用 “概率 思维 ”, 则 不 证 自明 : 按 二 项 分 布 的 定义 ， 
若 X~B(a,p), 则 X 是 在 2 次 独立 试验 中 事件 A 出 现 的 次 数 ， 
而 在 每 次 试验 中 A 的 概率 保持 为 p. 今 X; 是 在 2; 次 试验 中 A 出 
现 的 次 数 ,每 次 试验 A 出 现 的 概率 为 p. 故 Y=Xi1+…+ XX 是 
在 ni 十 … 十 7n,, 次 独立 试验 中 ,A 出 现 的 次 数 , 而 在 每 次 试验 中 A 
出 现 的 概率 保持 为 p. 故 按 定 义 即 得 Y~B(niy+… 十 nm,p). 

例 4.3 设 Xi,X: 独立 ,分 别 服从 波 哇 松 分 布 P(41) 和 
P(%9)( 见 例 1.2). 证 明 :Y=Xi+ X, 服从 波 哇 松 分 布 PCAN + 
> ) 

Y 的 可 能 值 仍 为 一 切 非 负 整 数 .固定 这 样 一 个 六 , 则 由 独立 性 
假定 及 波 哇 松 分 布 的 形式 (1.7) ,有 

.85 . 


P(Y =&) = 了 >P(OXI = ki, Xs = k;) 
~ > P(X, = k1)P(X, = k,) 
= > eA /kl :ehAg /ks! 
=e Qt /pt > 从 
这 里 >， 的 求 和 范围 与 上 例 相同 ,因而 这 个 和 等 于 (Ai1+ 和)*. 故 
P(Y = k) = ee tt) (A 十 2) /RI 
因而 证 明了 所 要 的 结果 .这 结果 也 自然 地 可 推广 到 多 个 的 情形 . 
在 例 1.2 后 面 我 们 对 波 哇 松 分 布 通 过 二 项 分 布 而 产生 的 过 程 
作 了 一 个 解释 ,利用 这 个 解释 的 架构 ,不 须 计 算 即 可 容易 看 出 这 个 
结论 .我 们 留 给 读者 自己 去 完成 . 这 样 解 释 的 目的 , 倒 不 在 于 为 了 
避免 计算 (就 本 例 而 言 ,计算 很 简单 ,可 能 比 通过 上 述 解释 还 简便 
些 ) ,而 是 它 使 人 了 解 为 什么 会 有 这 个 结果 (前 面 几 个 例子 也 如 
此 ). 形 式 的 计算 使 人 相信 结果 是 对 的 ,但 不 能 提供 直观 上 的 启发 
性 . 


2.4.2 连续 型 分 布 的 情况 :一 般 讨 论 


本 节 的 其 余部 分 将 讨论 更 有 兴趣 的 连续 型 情况 . 这 一 段 对 处 
理 这 种 问题 的 一 般 方 法 作 些 介绍 ,然后 在 2.4.3,2.4.4 两 段 中 ,分 
别 对 两 个 在 数理 统计 学 上 重要 的 情况 专门 进行 讨论 ,并 由 此 引出 
在 数理 统计 学 上 几 个 重要 的 概率 分 布 . 

先 考虑 一 个 变量 的 情况 . 设 X 有 密度 函数 f(x). 设 Y= 
g(x),g 是 一 个 严格 上 升 的 溺 数 , 即 当 zli<z 时 , 必 有 g(zi)< 
g(X2). 又 设 g 的 导数 g 存在 .由 于 g 的 严格 上 升 性 ,其 反 函 数 义 
=A(Y) 存 在 且 hh 的 导数 hh 也 存在 . 

任 取 实数 y. 因 g 严格 上 升 ,有 


P(Y <y) = P(g(X) < = PKS) = 人 fd 


Y 的 密度 最 数 1(y), 即 是 这 个 表达 式 对 y 求 导数 ( 见 定义 1.3). 
四 %6 a 


有 

1(y) = f(h(y))h (y) (4.2) 
如 果 Y=g(X) 而 g 是 严格 下 降 , 则 ig(XX) 研 yl 相当 于 
{X 宇 hi(Y)| .于 是 


P(Y<y) = P(e(X) <y) = PCX>>hCD)) = fd 


对 y 求 导 数 , 得 Y 的 密度 呵 数 
i(y) =— f(h(y)h (y) (4.3) 
因为 当 g 严格 下 降 时 ,其 反 函 数 请 也 严格 下 降 , 故 h“(y)<<0. 这 
样 1(y ) 仍 为 非 负 的 . 总结 (4.2),(4.3) 两 式 , 得 知 在 g 严格 单调 
(上 升 下 降 都 可 以 ) 的 情况 下 ,总 有 g(X) 的 密度 函数 i(y) 为 
i(y) = fl(h(y)) ph (y))] (4.4) 
例 4.4 Y=aX+6b,a 关 0. 反 隐 数 为 X=(Y 一 5)/a. 由 
(4.4) 得 出 :aX + 6 的 密度 函数 为 
1(y) = fl((y ~- b)/a)/lal (4.5) 
若 X 有 正 态 分 布 N(4,o), 则 据 正 态 密 度 函 数 的 表达 式 (1.14) 和 
公式 (4.5), 易 算出 aX+4。5 服从 正 态 分 布 N(ax + 5,a*o’). 特 别 ， 
当 Y=(X-A)《M 时 ,有 Y 一 N(C0,1). 这 一 点 在 例 1.6 中 已 指出 
过 了 . 
当 Y= g(X) 而 g 不 为 严格 单调 时 ,情况 复杂 一 些 , 但 并 无 原 
则 困难 .我 们 不 去 考虑 一 般 情 况 ,而 只 注意 一 个 特例 Y= 对?. 仍 以 
f 记 XX 的 概率 密度 . 因 了 非 负 ,有 P(Y 委 >y) =0 当 y 委 0. 若 y> 
0, 则 有 
Pl(Y<y)=P(X*<y)= P(-vy 生 X 雪 vvy) 


-三 ro 
二 AR t jdt 
对 y 求 导数 ,得 Y 的 密度 函数 1(y) 为 
1(y) = 3y [f(y) + f(-Yy)], 当 y>0 


而 当 yS0 时 1(y)=0. 下 面 的 特例 很 重要 . 
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例 4.5 若 X 一 N(0,1) , 试 求 Y=X- 的 密度 函数 . 
以 f(z)= (V2x) le-*2 代 入 上 式 , 得 
1(y) = (V2Ay) le 2, 当 y>0.1(y)= 0 当 y<0 
(4.6) 
现在 考虑 多 个 变量 的 函数 的 情况 ,以 两 个 为 例 . 设 (Xi,X2) 的 
密度 函数 为 F(zi,zz),Yi,Y: 都 是 (Xi,X2) 的 因数 : 
Yi = gi(Xi, X),Y>, = go(XI,X2) (4.7) 
要 求 (Yi,Y2) 的 概率 密度 图 数 !(yiyy). 在 此 ,我 们 要 假定 (4.7) 
是 (Xi,X2?) 到 (Yili,Y2) 的 一 一 对 应 变换 ,因而 有 逆 变 换 
XI = 由 (YY ),X = hl Yi, YY;) (4.8) 
又 假定 g1, g2 都 有 一 阶 连续 偏 导 数 .这 时 , 道 变 换 (4.8) 的 函数 
Ai ,Ah 也 有 一 阶 连续 偏 导数 , 且 在 一 一 对 应 变换 的 假定 下 ,要 可 比 
行列 式 
0h7My Qh1i/9y; 


4.9 
9h2/9y!: 9Aha279ya 2 


J(y1,y2) = 


不 为 0. z 

现在 我 们 在 (Yi, Y;) 的 平面 上 任 取 一 个 区 域 A. 在 变换 
(4.8) 之 下 ,这 区 域 变 到 (Xi1,X,) 平 面 上 的 区 域 B. 就 是 说 ,事件 
i(Y1, Y2)€ Al 等 于 事件 1(X1, 久 ;)€ BI1. 考虑 到 是 (XI, XX,) 
的 密度 函数 ,有 


P((Y1,Y2) € A) = P(X1,X2) € B) = | F(ziza)dzidzs 


使 用 重 积分 变数 代 换 的 公式 ,在 变换 (4.8) 之 下 ,上 式 最 右 端 一 项 
的 重 积分 变换 为 


PCACYi， Y> ) 和 A) = | Pain ii) 


“| J (yi1,y2) | dy1dy? (4.10) 
此 式 对 ( Yi, Y;) 平 面 上 任何 区 域 A 都 成 立 .于 是 , 按 定 义 2.2( 见 
《2.5) 式 )), 即 得 (Yi, Y2z) 的 密度 函数 为 
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(viyy) = FAi(yiyy) Pay y2) | I (yi, y2)| 
(4.11) 
一 个 重要 的 特例 是 线性 变换 
YI = CI 有 XI 二 QQl2X2y Ya = Q21IZI 十 Q22 人 入， (4.12) 
假定 变换 的 行列 式 aitaz 一 a12Q421 关 0, 则 逆 变 换 (4.8) 存 在 且 仍 
为 线性 变换 : 
XI 一 blI 十 pl2Y2，X> = bY1+ bY (4.13) 
此 变换 的 村 可 比 行 列 式 为 常数 ， 
J(y1sy2) = 1 = blp2 bub = (allda22 -atDa2) 
按 (4.11) 式 ,得 出 (Yi,Y2) 的 密度 图 数 为 
1/(yiy2) = f buy1 + bl2ya ay1 + 022yz)| pp22 — bi12021 
(4.14) 
例 4.6 再 回 过 头 来 考虑 例 3.6. 为 与 此 处 记号 一 致 ,把 该 例 
中 的 尺 和 @ 分 别 记 为 Yi,Yz, 这 时 逆 变 换 (4.8) 为 
Xj 二 YIJcoOSsY2，A> = YIsinY, 
贰 可 比 行列 式 为 
J Cysy) = COSY»> 一 y1SINYy» 
因为 (XI,X;) 的 密度 消 数 为 


(zhza) = 37exp| (rz! + 3) | 


一 Yl 


Siny2 YI1COSY2 


而 zi+ 好 = yfcos y2++ yisiny = y?, 由 公式 (4.11), 得 (Yj, Y,) 
的 概率 密度 函数 为 于 e -32y1. 变量 范围 为 0< < oo ,0 过 ?< 
2x. 在 这 个 范围 之 外 为 0. 这 与 例 3.6 中 求 出 的 一 至 


本 例 还 提醒 了 我 们 一 点 :必须 注意 变换 以 后 变量 的 范围 . 光 从 
公式 (4.11) 上 有 时 并 不 能 看 清 这 一 点 .在 本 例 中 ,因为 (Yi,Y,) 


是 点 的 极 坐标 ,其 范围 易于 判定 ,在 有 些 例 子 中 , 则 需 经 过 一 定 的 
判断 .看 下 面 的 例子 . 
例 4.7 设 XX1,X; 独立 ,都 服从 指数 分 布 (1.20), 其 中 A=1. 
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而 设 Yi1=Xi+X,Y=XI-X, 求 (YYy2) 的 密度 栗 数 . 

用 公式 (4.11) 不 难 算出 密度 函数 为 1(y1,y2) = 三 em. 问题 
在 于 :这 个 表达 式 只 在 一 定 范围 B 内 有 效 , 在 B 外 为 0.B 是 什 
么 ? 这 就 要 考虑 到 (Xi , X;) 只 在 第 一 象限 A 内 大 于 0. A 的 两 条 
边 , 即 两 轴 的 正 半 部 ,分 别 相 应 于 (Yl,Y;) 平 面 上 的 直线 Yi = Y， 
和 Yi= - Y:( 见 图 2.10). 另 外 ,Yi = Xi + X,， 必 大 于 0,Y 必 大 
于 YY . 故 (Yi,Y2) 只 能 落 在 上 述 两 条 直线 所 夹 出 的 包含 Yi 正 半 
轴 的 那 部 分 , 即 图 2.10 中 标示 的 B. 


图 2.10 


有 时 ,我 们 所 要 求 的 只 是 一 个 函数 

Yi = gi1(X1,X>,) 
的 分 布 .一 个 办 法 是 对 任何 y 找 出 |Y| 志 y| 在 (Xi, 义 ,) 平 面 上 对 
应 的 区 域 ig1(Xi1, X;) 志 yj, 记 为 A,. 然后 由 P(Y; 二 y) = 


用 Cai,z2)dzidzz 找 出 Y1 的 分 布 . 另 一 个 办 法 是 配 上 另 一 个 也 
数 Y= ga( Xi,X2) ,使 (Xi,X2) 到 (Yi, Y;) 成 一 一 对 应 变换 .多 
后 按 (4.11) 找 出 (Yi, Y2) 的 联合 密度 函数 (yi, ys). 最 后 , Yi 的 
密度 函数 由 公式 |/(y1,y2)dys 给 出 ( 见 (2.9)). 后 面 将 给 出 使 
用 这 个 方法 的 重要 例子 . 

以 上 所 说 可 完全 平行 地 推广 到 n 个 变量 的 情形 : 设 (Xi ，…， 
X,) 有 密度 函数 /(z1,… ,xz, ) ,而 
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Y = (XI 
构成 (Xi X,) 到 (YY ) 的 一 一 对 应 变换 ,其 逆 变 换 为 
X, = h(Y, ,YY ),i = 1,,n 
此 变换 的 机 可 比 行列 式 为 
ohi/9Oy: 7 gh/9y, 
J yl, y,) 一 。。。 。 
9h, /dy oh, /9Yy, 
则 (YY! ,…, YY; ) 的 密度 函数 为 
Ly yn) = fh ys Yn) hn yl yn )) 
| Jo (4.15) 


2.4.3 随机 变量 和 的 密度 函数 


设 (X1,X;) 的 联合 密度 消 数 为 FCzly,zz), 要 求 
Y = X,+ XX 

的 密度 鹃 数 . 

一 个 办 法 是 考虑 事件 

[IY<y|) = {XI+ XS y| 

它 所 对 应 的 (Xi, 闵 ;) 坐 标 平面 上 的 集合 
B, 就 是 图 2.11 中 所 示 的 直线 rz + z=y 
的 下 方 那 部 分 . 按 密度 图 数 的 定义 有 

P(Y 委 yy)= PIXI+X 委 >y) 


一 | f(r1sz2)dridr 图 2.11 
» 


将 重 积 分 化 为 罕 积 分 , 先 固 定 zi 对 x, 积分 ,积分 范围 为 - co 到 
y 一 Xx1, 如 图 所 示 . 然 后 再 对 zl 从 - ce 到 ce 积分 .结果 得 


P(Y < y) = | (| fra) dra da 


XtXR2= 


对 y 求 导数 , 即 得 Y 的 密度 函数 为 
i(y) =| f(r,y — XI1)dxi 


。 9] 。 


-| flr,y 一 工 )d (4.16) 


作 变 数 代 换 1 = y 一 x (注意 y 是 固定 的 ), 再 把 积分 变量 t 换 回 到 
Z, 也 得 到 


LO) = | Fo -rz)dz (4.17) 


如 果 Xi1,X2 独立 , 则 f(zi,z2)= fi1(z1)f2(x2). 这 时 (4.16) 和 
(4.17) 有 形式 


L(y) =| f(z)fly 一 ZX)dx 


=| Agy-z)P(z)dz (4.18) 


这 个 方法 在 数学 上 一 点 不 足 的 地 方 是 要 通过 在 积分 号 下 求 导 
数 .这 在 理论 上 是 有 条 件 的 . 另 一 个 做 法 是 配 上 另 一 个 函数 ,例如 
2Z。=Xi. 则 
Y= XI+ X,Z = XI 
构成 (Xi,X2) 到 (Y,Z) 的 一 一 对 应 变换 . 逆 变 换 为 
Xi = Z,X,= Y-Z 
贯 可 比 行列 式 为 1, 绝对 值 为 1. 按 公 式 (4.11), 得 (Y,2Z) 的 联合 
密度 图 数 为 f(z,y 一 z). 再 依 公 式 (2.9), 求 得 Y 的 密度 函数 
1y) 仍 为 (4.16) 式 . 
例 4.8 设 Xi,X; 独立 ,分 别 服从 正 态 分 布 N(p1,o?) 和 
N(p2,03). 求 Y= Xi+X, 的 密度 函数 . 
由 假定 ,利用 (4.18) 的 第 一 式 , 有 
oo 2 
1(y) = ji |- -#9 Cy > ee] 
(4.19) 
经 过 一 些 初 等 代数 的 运算 ,不 难得 到 
(z -pi) /ott+(y- zr- pp) /03 
= (of +o3) i(y—- pp2) + (ar— 6b) 
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其 中 
a =o10r9/V of+ 03 


O102 


(uo + (y— jp2)07”) 
/3 > 
GT 十 G5 


b= 


代 人 (4.19) ,得 


人 一 入 1 
i(y) (2xo102) exp| 2(z? 4 3) © dx 


注意 4a,6 都 与 x 无 关 , 作 变数 代 换 t=az+65, 并 利用 | ”e ?dt 


= V2x( 见 (1.15) 式 ) , 即 得 
1(y) = (V2ar(of + o3)) x 
exp| -村 (一 和 一 AM + o3)| (4.20) 
这 正 是 正 态 分 布 NCA + wa ,ci+co) 的 密度 函数 .由 此 可 见 , 两 个 
独立 的 正 态 变 量 的 和 仍 服从 正 态 分 布 , 且 有 关 的 参数 相 加 ， 

有 趣 的 是 ,这 个 事实 的 逆 命 题 也 成 立 :如果 Y 服从 正 态 分 布 ， 
而 Y 表 成 两 个 独立 随机 变量 Xi ,X, 之 和 , 则 Xi ,XX 必 都 服从 正 
态 分 布 .这 个 事实 称 为 正 态 分 布 的 “再 生性 ”: 一 条 虹 虹 人 砍 成 两 段 ， 
仍 各 成 一 条 是 虹 ,这 称 为 是 虹 的 再 生性 ;此 处 亦 然 :一 个 正 态 变量 
Y 了 克成 独立 的 两 段 Xi,X;(Y= Xi+X2), 各 段 Xi,X， 仍 不 失 其 
正 态 性 .这 个 深刻 命题 的 证 明 超 出 了 本 书 的 范围 . 

不 难 证 明 : 即 使 X|,X, 不 独立 ,只 要 其 联合 分 布 为 二 维 正 态 
N(psp2301,05,0), 则 Y= Xi 二 Xs 仍 为 正 态 : Y 一 N (pi +p， 
of 二 0 二 20o103). 证 明 与 本 例 相 仿 , 细 节 留 给 读者 . 

本 例 直 接 推广 到 个 变量 的 情形 : 若 XX ,…, XX, 相互 独立 ， 
分 别 服 从 正 态 分 布 NO ,ci ,NO ec) , 则 XI+…+X, 服 
从 正 态 分 布 NA …… 二 AT 十 十 0 )》， 

证 明 很 容易 . 以 三 个 变量 的 情形 为 例 . 记 

Y= XI+X,+X3=Z+X3,Z = XI+X， 
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按 本 例 结 果 有 QZ 一 NApl+ jo,of+ ao). 又 按 定 下 3.3, 知 2 与 X3 
独立 .对 Z 和 X3 应 用 本 例 , 即 得 
Y=Z+X3 一 NG +AHAz+H3 oil+ oa+ 03) 
在 介绍 下 面 这 个 重要 例子 之 前 ,我们 先 要 引进 两 个 重要 的 特 
殊 胃 数 ; 
有 卫 函数 ( 读 作 Gamma 函数 ) 有 PCz): 通 过 积 
T(x)= | edi,a >0 (4.21) 
来 定义 .此 积分 在 x >0 时 有 意义 . 
8 因数 ( 读 作 Beta 了 数 )B(xz,y): 通 过 积分 
B(x,y) = [me — 1) ldt,r >0,y >0 (4.22) 
来 定义 .此 积分 在 x >>0,y>0 时 有 意义 . 


直接 算出 (1) = | erdt = 1, 而 在 作 变 数 代 换 ! = ww? 后 ， 
算出 
有 (17X2) =| eed = | eu (2udu) 


-了 edu 一 | edu 
令 :=uNM2, 并 利用 (1.1$) 式 ,得 


开 加 四 
有 (1A2) = 方 .。 “dz = V2x = VT 


1 
V2 
T(r+1)= xT(z) (4.23) 


事实 上 ,T(x + D = | eerdr. 作 分 部 积分 ,有 


oo oo Go 
| e ‘Tdr 一 | ide) 一 Fe’ 十 z| eitr-ldy 
“0 0 0 0 


= xT(x) 
由 算出 的 了 1) 和 了 (12), 可 得 出 当 为 正 整 数 时 , 厂 (n) 和 
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P(Z2) 之 值 (后 者 当 为 奇数 时 ,否则 /2 为 整数 ): 
T(x) = (no Dra/2) =1:3.5(00 -2)2 DYx 


(4.24) 
例如 
FT(4) =T(3+1)= 37(3) = 3.27T(2)=3.:.2.1T7T(1) 
=3.，2.1= 31 
T(7/2) =T(S5/2+1) = ($2)T(S/2) 
= {5/2)(3/2)T(372) 
=(5/2)(32)(1/2)T(1/2)=1.3.5.23Vx 
人 矿 隐 数 与 8 图 数 之 间 有 重要 的 关系 式 : 
B(x,y) = T(z)T(y)/T(r + y) (4.25) 
这 个 公式 的 证 明 见 本 章 附录 A. 
由 卫 画 数 的 定义 易 知 :和 若 ?>0, 则 郑 数 
] ez27z0c22 Gr 
0 rj 0 


0， 当 X 奈 0 
是 概率 密度 阴 数 . 实际 上 ,由 &, (zz) 的 定义 知 它 非 负 . 又 ( 作 变 数 代 
换 x 二 21) 


|， e ?7r(" dr = 2"?| et dr = 2"2T | 名， 
0 


改 知 | (x)dr = | k(x)dz = 1. 因而 证 明了 它 是 密度 本 
数 .这 个 密度 函数 在 统计 学 上 很 重要 且 很 有 名 , 它 称 为 “自由 度 
的 皮尔 逊 卡 方 密度 "(相应 的 分 布 则 称 为 卡 方 分 布 ), 常 记 为 x? 
K. 皮 尔 逊 是 英国 统计 学 家 ,现代 统计 学 的 英 基 人 之 一. 在 本 书 第 
五 章 中 将 涉及 他 的 工作 ， 
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例 4.9 若 Xi,…,X, 相互 独立 ,都 服从 正 态 分 布 N(0,1)”， 
则 Y= Xi+…+X2 服从 自由 度 n 的 卡 方 分 布 x%. 
”从 例 4.5, 并 注意 (1/2)=Vz, 看 出 本 例 的 结果 当 n=1 时 
成 立 . 于 是 可 用 归纳 法 , 设 此 结果 当 ” 改 为 n 一 1 时 成 立 . 表 Y 为 
Z+ Xz, 其 中 2Z= Xfi+… 二 Xi_1,; 则 由 归纳 假设 , 知 Z 有 密度 隔 
数 k&,_1(x). 由 例 4.5 知 Xs 有 密度 函数 ki(x). 再 由 定理 3.3, 知 
2 与 X2 独立 .于 是 按 公式 (4.18)( 用 前 一 式 ) , 知 Y 的 密度 函数 为 

1(y) = | 和 zaagy -XxX)dxr = Jk(y zx)dr 


后 一 式 是 因为 ,k, -1(!t) 和 k1(t ) 都 只 在 t>0 时 才 不 为 0, 故 有 效 
的 积分 区 加 为 0 夺 z 志 yy. 以 (4.26) 中 的 表达 式 (n 分 别 改 为 n 一 1 
和 1) 代 入 上 式 , 得 


_ 1 一 | 二 | 1 3 一 3 
1(») = 人 | 5 )2 r( 六 )2 ) e-: 
as ~ x) dr (4.27) 


在 积分 中 作 变 数 代 换 x = yt ,得 


"ey rz) 12dr 
=y" 02| e020 _ £) 12dr 
A 一 1 
= y D738 (一 , 广 ] 


_ (nn-2) n—l1 1 了 

> 2 2 Jr 并 ( 生 ) 
以 此 代入 (4.27), 即 得 1(y)=k&,(y). 从 而 证 明了 本 例 结果 对 nn 
也 成 立 , 这 完成 了 归纳 证 明 . 


* 常 把 这 说 成 六 1,…, 六 ,独立 同 分 布 并 缩 记 为 iid. (independently identically dis- 
tributed) ,并 说 六,… ,XX 有 公共 分 布 N(0,1). 注 意 不 要 混淆 “公共 ”分布 和 “联合 ”分 
布 .整个 这 假定 可 简 记 为 :X1,…,X, iid, ~ N(0,1). 
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本 例 也 解释 了 在 定义 卡 方 分 布 时 提 到 的 “自由 度 mn” 这 个 名 
词 . 因为 Y 表 为 ?2 个 独立 变量 Xi,…,X. 的 平方 和 ,每 个 变量 X 
都 能 随意 变化 ,可 以 说 它 有 一 个 自由 度 ,共有 7 个 变量 ,因此 及 
个 自由 度 . 当然 这 个 解释 只 在 ;为 正 整 数 时 才 有 效 ( 注 意 & (x ) 
的 定义 中 并 不 必须 限制 2 为 正 整数 ,只 要 n>0 就 行 ). 实 际 上 , 自 
由 度 这 个 名 词 通常 也 只 用 在 为 整数 时 . 

卡 方 分 布 有 如 下 的 重要 性 质 : 

1. 设 Xi,X， 独立， Xi ~ YX 一 X2， 则 X1T X2 一 XY 和 rn 

证 明 可 以 直接 利用 和 的 密度 公式 (4. 更 简便 的 是 从 
卡 方 变 量 的 表达 式 出 发 , 设 Yi,…, YY,;:, 独立 且 都 有 分 布 
N(0,1). 邻 Xi1= YI 十 Xi; = Y2 +…+Y2，，. 按 本 
例 , 有 

XI ~ XX 一 和 
和 而 
XI + X; = YT+ -十 YY， 
为 m+n 个 标准 正 态 变量 的 平方 和 . 按 本 例 其 分 布 为 y2,;,, 明 所 
2. 耕 XI，…,X, 独立 , 且 都 服从 指数 分 布 (1.20), 则 
: X = 24(X1 + + X,) ~ 3, 


首先 ,由 X; 的 密度 函数 为 (1.20), 知 24X; 的 密度 函数 为 寺 e- 
( 当 z>0.z 委 0 时 为 0). 但 在 (4.26) 中 令 n=2, 可 知 这 正好 是 y3 


的 密度 函数 ,因此 2AX; 一 X2. 再 因 Xi ,…,X, 独立 ,利用 刚才 证 明 
的 性 质 , 即 得 所 要 的 结果 . 


2.4.4 随机 变量 商 的 密度 函数 


设 (XI,X,) 有 密度 函数 f(z1,x;), Y= XX, /Xi. 要求 Y 的 密 
度 函 数 .为 简单 计 , 限 制 Xi 只 取 正 值 的 情况 . 
事件 |Y 委 y|} = 1X2AXI yy 可 写 为 1X 二 Xiy} ,因为 及 1 人 > 
0. 这 相应 于 图 2.12 中 所 标 出 的 区 域 B. 通 过 化 重 积分 为 累积 分 ， 
. 已 了 . 


得 到 
已 Y 三 y) = | f(x ra)dridz, 
B 


-Tien 
对 y 求 导 , 得 Y 的 密度 函数 为 
1(y) = | f(z riy)da 


图 2.12 (4.28) 
若 义 ,XX; 独立 , 则 f(x1,7X2) = 万 (zl)， 


六 (za), 而 上 式 成 为 
L(y) 一 | ifr) friy)dx (4.29) 


(4.28) 式 也 可 以 通过 添加 一 个 变换 Z = Xi, 再 运用 公式 (4.11) 和 
(2.9) 得 到 ,建议 读者 自己 去 完成 .这 个 做 法 不 须 在 积分 号 下 求 导 
数 . 

下 面 考察 两 个 在 统计 学 上 十 分 重要 的 例子 . 

例 4.10 设 Xi,X; 独立 ,XI 一 Xa 独立 ,X2 一 N(0,1) ,而 了 


= X2 人 XIA. 求 了 的 密度 函数 . 
记 Z=V Xi/n. 先 要 求 出 Z 的 密度 函数 g(z). 有 
Pl(Z zz)=P(YV Xi/n Sz) = P(X) < nz’) 
-| k, (xX)dz 
两 边 对 Z 求 导 ,得 Z 的 密度 函数 为 
g(z) = 2nzk, (nz’) 


其 次 ,以 fi(z1)=2nzik, (nz?) 和 f(z2)= V3 !e 2 应 用 公 
式 (4.29), 得 Y 的 密度 函数 , 记 之 为 上 (yy), 等 于 


fn(y) =v 2x (2"2T(n 2 Dnrie m2 ( nr?) -272 


， 0Q8 。 


.erCzi) dz 
= vV28 (272T(n /2)) 12n"? 
| riexp| - (nz + zy2) |dz (4.30) 
作 变 数 代 换 zi =V 2A(n + y2)Vt ,上 面 的 积分 变 为 


n+1)/ roo 
1 2 《 十 上 加 加 
3 (3) e tpln 1)/2 0 
和 十 yy 0 


-=| 2 ) rT 
2\n 十 y” 2 


以 此 代入 (4.30), 并 略 加 整理 , 即 得 Y= X /XI 的 密度 函数 
为 


r((n + 1)72) 2\ 
ny (1 + | (4.31) 

这 个 密度 函数 称 为 “自由 度 2 的 上 分布 "的 密度 函数 , 常 简 记 
为 了 一 zt, .这 个 分 布 是 英国 统计 学 家 W. 哥 色 特 在 1908 年 以 “stu- 
dent 的 笔名 首次 发 表 的 . 它 是 数理 统计 学 中 最 重要 的 分 布 之 一 ， 
今后 我 们 将 见 到 这 个 分 布 在 统计 学 上 的 许多 应 用 . 

这 个 密度 函数 关于 原点 对 称 ,其 图 形 与 正 态 N (0,1) 的 密度 
光 数 的 图 形 相 似 , 以 后 我 们 将 见 到 ( 抑 第 三 章 3.4 节 ), 当 自由 度 7 
很 大 时 ,t 分 布 确实 接近 于 标准 正 态 分 布 . 

例 4.11 设 Xi,X2; 独立 ,XI 一 XXX， 而 了 = 7 
X?[m !Xi. 求 了 的 密度 函数 

因为 Xi1,X; 独立 , 故 n-!X)| 和 mn 1!X, 也 独立 .由 XI 一 7 
和 Xs 一 x 和 易 求 出 z Xi 和 m !X, 的 密度 函数 分 别 为 nk， 
(az 和 7aR (azo). 以 此 代 人 (4.29) ,得 了 的 密度 函数 , 记 之 为 
fr《(y)( 注 意 m1 在 前 ,m 是 分 子 X, 的 自由 度 ) ,等 于 


fm (y) = mn | ZI1R (nri) kn mriy) dr 


=mn|[2”2T( 合 ]2*2T( 台 ) ] 


tn(y) = 


2 
=。 人 已 。 


DO 
, | rie zz 人 Nz)" le "(mriy)™ dri 


—t 
一 [2052r( 且 Jr( 生 中 m™ ny 1 


(mytn)zr,/2 /2 
-| e myt n)zx) “人 二) 2 -1dzi 
0 


作 变 数 代 换 1 = 《my 十 n)zi 人 2, 上 式 的 积分 化 为 


2 mt) py 十 mm] e 和 (mt+z)2-1dt 
0 


一 十 
一 24m+2)02( py 十 n) ("tnaT (se 3 "| 


以 此 代入 上 式 , 得 


m+ n 
fa y) = p72n"1 TY) 十 77 ) mtn)2 
rT) 
y>0 (4.32) 
当 y<0 时 f(y)=0, 因 为 Y 只 取 正 值 . 

这 个 分 布 称 为 目 由 度 m,n 的 下 分 布 "(注意 分 子 的 自由 度 
在 前 ). 它 也 是 数理 统计 学 上 的 一 个 重要 分 布 , 有 很 多 应 用 , 常 记 为 
Fr:Y~F,,,. 

人 们 有 时 把 x*,t 和 下 这 三 个 分 布 合 称 为 “统计 上 的 三 大 分 
布 ,就 是 因为 它们 在 统计 学 中 有 广泛 的 应 用 .这 些 应 用 的 相当 大 
一 部 分 根 由 ,在 于 以 下 的 几 条 重要 性 质 .它们 的 证 明 可 参见 本 章 附 
录 B. 

1 设 X,…,X 独立 同 分 布 ,有 公共 的 正 态 分 布 


N(p,o”). 记 X = (XI1+ +X,)/n,S’ = 2 (xX; 一 和 )A(C7 一 
i=1 


| 去 
1D). 则 (nC— 1)S’*/o? = 2 (xX, -XX)/o* ~ Xn (4.33) 


2” 设 XX ,…,X, 的 假定 同 1°, 则 
Vn(X—)/S ~ 1, (4.34) 
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3” 设 XXX YY 独立,X 各 有 分 布 N(p1,of)， 
Y, 各 有 分 布 N( 2,05), 则 


ni ， 


a [DY -FPARBm -D/C -KYA -1))] 
| (4 .35) 


a 


说 一 上 ,7 一 ] 


b. 若 of 二 0o5, 则 


A/ mnt m2)[ (x -Y)- (x - p2)] 
/[S Cx, 一 以) 二 SY, —_Y)] ~ tm 2 (4.36) 


附 录 
A. 公式 (4.25) 的 证 明 
由 等 式 


oo : oo 
| uy lyr le “(tv dv = ce (uv)* le dm 
0 0 


出 发 , 作 变 数 代 换 w= uo, 知 右边 的 积分 等 于 | writer“do 即 
T(x). 于 是 
[ei gy = emiTz) 
两 边 对 u 从 0 到 om 积分 ,得 
T(r)T(y) = | 由 ed oldv 
对 里 面 的 积分 作 变数 代 换 : =u(1+ o) ,有 


oo 
| ut lo u(ltv) dy 
0 


= (1+ oa etz+y dt 


=(1+m)-tzr2P(zdW 
代 和 人 上 式 得 
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rr) = Tet oy) wt) dy A(D) 


作 变 数 代 换 1 二 vA(1+wv). 当 w 由 0 变 到 ww 时 ,zt 由 0 变 到 1. 文 
v7- DL 十 vw) (+ty) 
=(v/(1 + v1I + v) H+ 
= 17-1(1 _ 1 )>+! 
因而 w=z1/A(1 一 1:), 有 dv= (1 一 :1) “dt. 故 


| 10 + v) (rtWdvy = | ea -zt) dt = B(xz,y)(2) 
由 (1),(2) 两 式 即 得 (4.25). 
B. (4.33) 一 {4.36) 的 证 朋 
这 个 证 明 要 求 读者 对 正 交 方 阵 有 初步 知识 . 先 证 明 下 面 的 预 
备 事实 : 
引 理 设 Xi,X2 ,Xiid, 一 NO o2). 记 X = > Xm 
则 
a Vn(X 一 u)/o 一 N(0,1), 
b. Dx, — XX)*o” ~ Xa-1 
c.X 与 >) (X; - X) 独立 . 
证 找 一 个 nn 阶 正 交 方 阵 A ,其 第 一 行 各 元 都 是 1/Vn . 作 正 


Yi 入 1 


Y, 
由 于 A 为 正 交 变换 , 它 不 改变 平方 和 , 妈 > - > Y? 又 因 


正 交 方 阵 的 行列 式 为 1, 根据 公式 (4.15)， 注意 到 (Xi …， XX ) 的 
密度 函数 为 
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(V3xo)-"exp| - -了 > (Xx; 一 AD 
=(V 2x0) "exp| - 二 人 yz? 一 2 > 十 nz2) | 


以 及 了 x; = Vys (这 是 因为 A 的 第 一 行 各 元 都 是 1 ,因而 
yI= (zi+…+zn)MDP) ,得 知 (Yi，……Y.) 的 密度 函数 为 
(V Zro) "exp| - 5 2 一 24 Vny! 十 np ) | 


~ (VIne) le Vi) /0 (Ino) le Ye ... 
, (V IA0) le 2 
因此 ,(Y1,…, YY; ) 的 密度 可 分 解 为 n 个 函数 的 乘积 ,每 个 肖 数 只 
依赖 一 个 变量 . 据 定理 3.2, 即 知 Yi1,Y,,…,Y, 独立 , 且 
Yi 一 Napa2) Y; ~ N(0,0),i = 2 (3) 
再 据 定理 3.3, Yi 与 Yi+…+ Y$ 独立 ,但 


Dr Dy y? 
i=2 i=1 


-DR (PDX) = DX (4) 
而 Yj=vVnXX. 这 证 明了 c.a 和 bb 由 (3),(4) 及 卡 方 分 布 的 定义 立 
即 得 出 . 引 理 证 毕 . 

有 了 这 个 引 理 就 不 难得 出 (4.33) 一 (4.36). 事 实 上 ,(4.33) 就 
是 这 引 理 的 b. 为 证 (4.34) ,注意 vz(X-w)va 服从 正 态 分 布 
NI(0,1) ,由 引 理 的 b,Sve 的 分 布 与 Vy2_iXC2 一 1) 的 分 布 相同 . 
又 按 引 理 的 ec,yz(X-w) 与 S 独立 .于 是 由 上 分 布 的 定义 即 得 
(4.34).(4.35) 由 引 理 的 b 及 下 分 布 的 定义 得 出 . : 

(4.36) 的 证 明 略 复杂 一 些 . 暂 记 Z! = Sx, — 多) ,2Z, = 
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> (y -了 立 ):. 据 引 理 的 c, 束 与 2 独立 ,了 与 2, 独立 ,又 因 X 
z 一 工 


,Xa ，Y1,"… ,Ym 全 体 独 立 , 故 X,Y,2Z;,2Z2 四 者 独立 .因为 XX ~ 
N(u1,0°/n),Y ~ N(pj2,0“/m),o? 为 of 和 o3 的 公共 值 , 据 例 


一 - 十 一 一 
4.8, 知 广 - 立 一 No -po2ma +azym) ,因而 ,/ 二 从 土 [( 运 


nm oa 
—Y) — (pg1 一 412) | 一 入 (0,1). 又 据 (4.33), 有 Ze ~ Xn-1 
Z2/0 一 y%-1, 因 ZL1,L2 独立 , 按 卡 方 分 布 的 性 质 , 有 (2 十 Z2)/ 
o 一 Xa+m-2. 因 XX,Y,21,22 四 者 独立 , 按 第 二 章 定理 3.3, 知 


Wi =\/ 对 二 本 [XY) - (pi -pa)] 与 
12 
W, = 2 + 22) | 二 者 独立 


按 z 分 布 的 定义 知 , Wi7W2 一 如 +m -2 这 就 证 明了 (4.36)， 
可 以 注意 一 下 这 些 结果 中 的 自由 度数 目 .在 (4.33)， > (X - 


束 )? 为 n 个 量 的 平方 和 ,为 何 自 由 度 只 有 n - 1? 这 是 因为 ,X，- 
义 ,…,X 一 文 这 ?个 量 并 不 能 自由 变化 ,而 是 受到 一 个 约束 , 即 
》) (X; - X) = 0. 这 使 它 的 自由 度 少 了 一 个 .(4.36) 中 的 自由 度 
是 n+ m 一 2 也 一 样 地 解释 :一 共有 n+ mm 个 量 X, 一 下 (i = 1,…， 
n) 和 Y; -了 (j = 1,…,m) 取 平 方 和 . 它们 受到 两 个 结束 , 即 
2 (Xi - 文 ) = 0, > (YY 了 ) = 0. 少 了 两 个 自由 度 , 故 自由 度 
不 为 n + m 而 为 n + pi -2. 


在 第 四 章 例 3.2 中 ,将 给 自由 度 这 个 概念 以 另 一 个 解释 . 不 言 
而 喻 ,不 同 的 解释 只 是 形式 上 的 差别 ,实质 并 无 不 同 . 


习 题 


1. 茶 事件 A 在 一 次 试验 中 发 生 的 概率 为 1/2. 将 试验 独立 地 重复 ， 次. 
证 明 :“A 发 生 个 数 次 ”的 概率 为 12, 不 论 n 如 何 (0 算 偶数 ). 
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2. 在 上 题 中 , 关 A 在 一 次 试验 中 发 生 的 概率 为 p, 则 “A 发 生 偶数 次 的 


概率 为 p。= 证 [1+ (1 ~ 2p)"]. 用 归纳 法 . 

3. 两 人 分 别 各 拿 一 个 均匀 铜板 投掷 n 次 (每 次 挪 出 正 .反面 的 概率 都 是 
1 忆 ). 问 “两 个 掷 出 的 正面 数 相同 ”这 事件 的 概率 是 多 少 ? 

4. 甲乙 二 人 赌博 .每 局 甲 胜 的 概率 为 p, 乙 胜 的 概率 为 q=1-p. 约 
定 : 赌 到 有 人 胜 满 a 局 为 止 ,到 这 时 即 算 他 获胜 . (a) 求 甲 胜 的 概率 .(b) 若 户 
= 1/2, 用 (a) 的 结果 以 及 用 直接 推理 ,证 明 甲 胜 的 概率 为 12. 

5. 以 2032z) 记 二 项 分 布 概率 (#1)"…. 证 明 :() 才 p17/ 
(n+1), 则 当 & 增加 时 5b(4;n,p) 非 增 .(b) 若 p 守 1 一 1A(n+1), 则 当 增加 
时 5(k;n, 思 ) 非 降 .(c) 若 1An+1)< 之 p<<1 一 1An+1), 则 当 & 增加 时 ， 
b( 上 ;nn, 思 ) 先 增 后 降 . 求 使 b(k;n,p) 达 到 最 大 的 上 . 

6.10 个 球 随机 地 放 进 12 个 盒子 中 , 问 : 空 盒 (不 含 球 的 盒 ) 数 目 为 10” 
这 事件 的 概率 是 多 少 ? 

7. 设 随机 变量 XX 服从 二 项 分 布 B(n,p),& 为 小 于 n 的 非 负 整数 , 记 f 
(p)= P(XEL). 

(a) 用 直观 说 理 的 方法 指明 : f(p) 随 p 增加 而 下 降 . 

(b) 用 概率 方法 证 明 (a) 中 的 结果 . 

(c) 建立 恒等式 


1(p) = Flr -dt 


从 而 用 分 析 方 法 证 明了 (a) 中 之 结论 . 

8. 设 随 机 变量 Xi ,XX; 独立 同 分 布 ,而 Xi + X2 服从 二 项 分 布 B(2, pp). 
则 X1,X2 都 服从 二 项 分 布 B(1,p)( 即 P(XI=1)=p,p(Xi=0)=1- 2p)， 
若 只 假定 X1,X; 独立 且 都 只 取 0,1 为 值 ,这 结论 也 对 ， 

9. 在 超 几 何 分 布 (1.10) 中 国定 ,mm , 令 N 一 co ,M 一 ce 但 M/N 一 p,0 
夺 p 人 ] .证 明 :(1.10) 以 5(mm;n, 力 ) 为 极限 . 

10. 设 随机 变量 X 服从 波 畦 松 分 布 P(A).k 为 正 整 数 . 

(a) 用 概率 方法 证 明 :P(X<&) 随 4 增加 而 下 降 . 

(b) 建立 恒等式 


P(X 上 )= 而 | eds 
从 而 用 分 析 方 法 证 明 (a) 中 之 结论 . 
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11. 记 PP(&)=e AR 证明:(a) 若 1 魏 1, 则 p(k) 随 增加 而 非 增 . 
(b) 若 4 之 1, 则 py(&) 先 增 后 降 , 找 出 使 p(k) 达 到 最 大 的 上 . 

12. 有 一 个 大 试验 由 两 个 独立 的 小 试验 构成 . 在 第 一 个 小 试验 中 ,观察 
某 事件 A 是 否 发 生 ,A 发 生 的 概率 为 pi ;在 第 二 个 小 试验 中 ,观察 某 事件 B 
是 否 发 生 ,B 发 生 的 概率 为 p,. 故 这 个 大 试验 有 4 个 可 能 结果 :(A,B)， 
(A,B),(A,B),(A,B). 把 这 大 试验 重复 NN 次 . 记 

El =|1(A,B),(A,B) 总共 发 生 7 次 | 
。 E, =|((A,B) 发生 次 | 
计算 条 件 概 率 P(E,|E1), 证 明 它 等 于 b(k;n,p), 其 中 p= pi(1 -ps)/p 
(1 一 pz)+(1~p1)p2j, 并 用 直接 方法 (不 通过 按 条 件 概率 公式 计算 ) 证 明 这 
个 结果 . 

13. 设 Xi，…X 独立 同 分 布 ,其 公共 分 布 为 几何 分 布 (1.12). 用 归纳 法 
证 明 :Xi+…+X; 服从 负 二 项 分 布 (1.11). 又 :对 这 个 结果 作 一 直观 上 的 解 
释 , 因 而 得 出 一 简单 证 法 . 

14. 在 一 串 独 立 试验 中 观察 某 事件 A 是 否 发 生 , 每 次 A 发 生 的 概率 都 
是 p. 有 以 下 两 个 概率 ;(1)pi= 做 i+r 次 试验 ,A 出 现 r 次 的 概率 . (2)p, = 
做 试验 直到 A 出 现 - 次 为 止 ,到 此 时 A 有 i 次 不 出 现 的 概率 .二 者 都 是 做 ; 
+r 深 而 A 出 现 r 次 ,但 总 有 Pi 这 pz2. 证 明 这 一 事实 并 给 一 解释 . 

15. 先 观察 一 个 服从 波 哇 松 分 布 P(A) 的 随机 变量 之 值 X ,然后 做 X 次 
独立 试验 ,在 每 次 试验 中 某 事件 A 发 生 的 概率 为 p. 以 Y 记 在 这 XX 次 试验 中 
4 发 生 的 次 数 , 证 明 :; YY 服从 波 哇 松 分 布 P(Xp). 

16. 设 随机 变量 X,Y 独立 ,X 有 概率 密度 /(x), 而 Y 为 离散 型 ,只 取 
两 个 值 al 和 a2z, 概 率 分 别 为 pil 和 p2. 证 明 : 六 十 Y 有 概率 密度 (zx): 

h(xz)= pif(z— a1) + paf(x — a2) 
把 这 个 结果 推广 到 Y 取 任 意 有 限 个 值 以 至 无 限 个 值 ( 但 仍 为 离散 型 ) 的 情 
况 . 

17. 设 义 ,Y 独立 ,各 有 概率 密度 函数 F(z) 和 eg(y), 且 X 只 取 大 于 0 
的 值 .用 以 下 两 种 方法 计算 Z= XY 的 概率 密度 ,并 证 明 结 果 一 致 . 

(a) 利用 变换 Z= XY,W= XX. 

(b) 把 XY 表 为 Y/X…1. 先 算出 X "的 密度 ,再 用 商 的 密度 公式 
(4.29). 

18. 设 X,Y 独立 ,X 有 概率 密度 f(xz),Y 为 离散 型 ,其 分 布 为 . 
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P(X = a;) = p;,i = 1,2,.…,p; > 0,i = 1,2,.: 
证 明 : 若 cl ,az,… 都 不 为 0, 则 XY 有 密度 函数 


h(xz) = Ppla [1 f(x /a;) 


若 al,as,… 中 有 为 0 的, 则 XY 没有 概率 密度 函数 
19. 设 Y 为 只 取 正 值 的 随机 变量 , 旦 logY 服从 正 态 分 布 Na,o). 求 
Y 的 密度 函数 4(Y 的 分 布 称 为 对 数 正 态 分 布 ). 


20. 设 X 服 从 自由 度 为 = 的 上 分 布 ,而 Y=X/Y a+ XX*, 其 中 4a>0 为 
常数 , 试 求 Y 的 密度 函数 . 

21. 设 X~N(0,1),Y=cosX, 求 立 的 密度 函数 . 

22. 设 Xi，…X, 独立 同 分 布 ,Xi 有 分 布 肖 数 F(z) 和 密度 晴 数 f(x ). 
IC 

Y = max(X , X,),Z = min(X mm X ) 

证 明 :Y,2Z 分 别 有 概 率 密度 盟 数 zaF (x)f(x) 和 nf[1- F(x)]”" 1:f(zx). 

23. 续 上 题 , 若 FAX) 为 .0,09j 上 的 均 久 分布 (9>0 为 常数 ). 用 上 题 结 果 
证 明 ;8 一 max(X1,…,X, ) 与 min( XXX) 的 分 布 相同 ,并 从 对 称 的 观点 
对 这 个 结果 作 一 直观 的 解释 . 

24. 设 Xi,X; 独立 同 分 布 ,其 公共 密度 为 
ee ) 工 之 0 
0，Zz 近 0 
记 Y1= min( Xi ， X2),， Yi=max( Xi X2) 一 min(Xi,X2) .证明 :YY 与 刀 独 
立 , Yi 的 分 布 与 Xi 的 分 布 同 ,Y> 的 分 布 与 Xi 同 ( 直 接 计算 概率 P(Y， 
,YL)). 

25. 一 大 批 元 件 其 寿命 服从 指数 分 布 (1.21). 固 定 一 个 时 间 人 >0. 让 一 
个 元 件 从 时 刻 0 开始 工作 .每 当 这 元 件 坏 了 马上 用 一 个 新 的 替换 之 .以 X 记 
到 时 刻 工 为 止 的 替换 次 数 .证 明 :X 服从 波 哇 松 分 布 P(AT), 即 已 (X=7)= 
e “al (用 归纳 法 , 详 见 提示 ). 

26. 证 明 F(a)=FFn(1-a),0<a<l. 

27. 设 (X,Y) 服 从 二 维 正 态 分 布 NOa,b,at,ai,o). 证 明 : 必 存在 常数 
b, 使 XX+6bY 与 XbY 独立 . 

28. 设 (XX,Y) 有 密度 鸳 数 


C 
Hz -| 1y <!1 


0， 当 区 十 y >1 


f(z) = 
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(a) 求 出 常数 c. (b) 算 出 X,Y 的 边缘 分 布 密度 ,并 证 明 X,Y 不 独立 . 
29. 证 明 : 对 任何 自然 数 &,2 及 0<a<1, 有 
kFi,n(a) 之 Fin(a) 
(实际 成 立 严 格 不 等 号 ). 
30. 设 X,Y 独立 ,都 服从 标准 正 态 分 布 N(0,1), 以 f(xz,y) 记 (X,Y) 
的 联合 密度 炒 数 .证 明 ; 晃 数 
f(z,y) + xy/100, 当 z? 二 y 声 1 
flx,y), 当 zx*+y>1 
是 二 维 概率 密度 函数 .车 随机 向 量 (U,V) 有 密度 函数 g(xz,y), 证 明 : U,V 
都 服从 标准 正 态 分 布 N(0,1), 但 (U,V) 不 服从 二 维 正 态 分 布 : 
本 例 说 明 ; 由 各 分 量 为 正 态 推 不 出 联合 分 布 为 正 态 . 


g(x,y) = 
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第 三 章 随机 变量 的 数字 特征 


在 前 章 中 ,我 们 较 仔 细 地 讨论 了 随机 变量 的 概率 分 布 ,这 种 分 
布 是 随机 变量 的 概率 性 质 最 完整 的 刻画 .而 随机 变量 的 数字 特征 ， 
则 是 某 些 由 随机 变量 的 分 布 所 决定 的 常数 , 它 刻 画 了 随机 变量 (或 
者 说 ,刻画 了 其 分 布 ) 的 某 一 方面 的 性 质 . 

例如 ,考虑 某 种 大 批 生 产 的 元 件 的 寿命 .如 果 知 道 了 它 的 概率 
分 布 ,就 可 以 知道 寿命 在 任 一 指定 界限 内 的 元 件 百分率 有 和 多少, 这 
对 该 种 元 件 寿 命 状况 提供 了 一 幅 完 整 的 图 景 .如 下 文 将 指出 的 , 根 
据 这 一 分 布 就 可 以 算出 元 件 的 平均 寿命 m , m 这 个 数 虽 则 不 能 对 
寿命 状况 提供 一 个 完整 的 刻画 ,但 却 在 一 个 重要 方面 , 且 往 往 是 人 
们 最 为 关心 的 一 个 方面 ,刻画 了 元 件 寿命 的 状况 ,因而 在 应 用 上 有 
极 重要 的 意义 .类 似 的 情况 很 多 ,比如 我 们 在 了 解 某 一 行业 工人 的 
经 济 状况 时 ,首先 关心 的 恐怕 会 是 其 平均 收入 ,这 给 了 我 们 一 个 总 
的 印象 . 至 于 收入 的 分 布 状况 ,除非 为 了 特殊 的 研究 目的 , 倒 反 而 
不 一 定 是 最 重要 的 . 

另 一 类 重要 的 数字 特征 ,是 衡量 一 个 随机 变量 (或 其 分 布 ) 取 
值 的 散布 程度 . 例如 ,两 个 行业 工人 的 平均 收入 大 体 相 近 , 但 一 个 
行业 中 收入 分 配 较 平均 :大 多 数 人 的 收入 都 在 平均 值 上 下 不 远 处 ， 
其 "散布 小 ; 另 一 个 行业 则 相反 :其 收入 远离 平均 值 者 甚 多 ,散布 
较 大 ,这 二 者 的 实际 意义 当然 很 不 同 .又 如 生产 同一 产品 的 两 个 工 
广 ,各 目的 产品 平均 说 来 都 能 达到 规格 要 求 ,但 一 个 厂 波动 小 , 较 
为 稳定 , 男 一 个 厂 则 波动 大 ,有 时 质量 超标 准 , 有 时 则 低 于 标准 不 
少 , 这 二 者 的 实际 后 果 当 然 也 不 同 . 

上 面 论 及 的 平均 值 和 散布 度 ,是 刻画 随机 变量 性 质 的 两 类 最 
重要 的 数字 特征 .对 多 维 变量 而 言 , 则 还 有 一 类 刻画 各 分 量 之 间 的 
关系 的 数字 特征 .在 本 章 中 ,我 们 将 就 以 上 各 类 数字 特征 中 , 举 其 
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最 重要 者 进行 讨论 
3.1 数学 期 望 (均值 ) 与 中 位 数 


要 说 明 这 个 名 称 的 来 由 ,让 我 们 回 到 第 一 章 的 例 1.1. 甲 乙 二 
人 赌 技 相同 ,各 出 赌 金 100 元 ,约定 先 胜 三 局 者 为 胜 ,取得 全 部 
200 元 .现在 甲 胜 2 局 乙 胜 1 局 的 情况 下 中 止 , 问 赌 本 该 如 何 分 ? 
在 那里 我 们 已 算出 ,如 果 继 续 赌 下 去 而 不 中 止 , 则 甲 有 3《/4 的 机 会 
(概率 ) 取 胜 ,而 乙 胜 的 机 会 为 1/4. 所 以 ,在 甲 胜 2 局 乙 胜 1 局 这 
个 情况 下 , 甲 能 期 望 得 到 的 数目 ,应 当 确 定 为 


3 1 _ 一 
200x 寺 +0X 本 二 150( 元 ) 


而 乙 能 “期 望 ” 得 到 的 数目 , 则 为 

200x 闻 +0x 汝 = 50( 元 ) 
如 来 引进 一 个 随机 变量 X,X 等 于 在 上 述 局 面 ( 甲 2 胜 乙 1 胜 ) 之 
下 ,继续 赌 下 去 甲 的 最 终 所 得 , 则 X 有 两 个 可 能 值 :200 和 0, 其 概 
率 分 别 为 3/4 和 1/4. 而 甲 的 期 望 所 得 , 即 X 的 期望值, 即 等 于 

X 的 可 能 值 与 其 概率 之 积 的 累加 

这 就 是 “数学 期 望 ”( 简 称 期 望 ) 这 个 名 词 的 由 来 . 这 个 名 词 源 出 赌 
博 , 听 起 来 不 大 通俗 化 或 形象 易 懂 ,本 不 是 一 个 很 恰当 的 命名 ,但 
它 在 概率 论 中 已 源远流长 获得 大 家 公认 ,也 就 站 住 了 脚 根 . 另 一 个 
名 词 “ 均 值 "形象 易 懂 ,也 很 常用 ,将 在 下 文 解释 . 


3.1.1 数学 期 望 的 定义 


先 考 虑 一 个 最 简单 的 情况 . 

定义 1.1 设 随机 变量 X 只 取 有 限 个 可 能 值 a1,…,a. 其 概 
率 分 布 为 P(X=4a;)= pp;,i=1,…,m. 则 XX 的 数学 期 望 , 记 为 
F(X)* 或 EX, 定义 为 


* 五 是 期 望 Expectation 的 缩写 . 
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E(X) = aip1 + a2p2 + ampm (1.1) 

名 词 的 来 由 已 如 前 述 .数学 期 望 也 常 称 为 “均值 ”, 即 “随机 变 
量 取 值 的 平均 值 " 之 意 ,当然 这 个 平均 ,是 指 以 概率 为 权 的 加 权 平 
均 . 

利用 概率 的 统计 定义 ,容易 给 均值 这 个 名 词 一 个 目 然 的 解释 ， 
假定 把 试验 重复 N 次 ,每 次 把 X 取 的 值 记 下 来 , 设 在 这 N 次 中 ， 
有 Ni 次 取 ai,Nz 次 取 a2,…, Ni 次 取 aj. 则 这 NN 次 试验 中 义 
总 共 取 值 为 alNi+azNa+…+anN，, 而 平均 每 次 试验 中 X 取 
值 , 记 为 X ,等 于 

R= (clINi +aN +…+aN)ZN 
= al(NILN)+a( Ny/N) + + an(N,/N) 
NAN 是 事件 {X=a| 在 这 n 次 试验 中 的 频率 . 按 概率 的 统计 定 
义 ( 见 第 一 章 ,1.1 节 ), 当 NN 很 大 时 ,NN;/N 应 很 接近 p;. 因 此 , 义 
应 接近 于 (1.1) 式 右边 的 量 ,就 是 说 ,X 的 数学 期 望 E(XX) 不 是 别 
的 , 正 是 在 大 量 次 数 试验 之 下 ,X 在 各 次 试验 中 取 值 的 平均 . 

很 自然 地 ,如 果 X 为 离散 型 变量 , 取 无 穷 个 值 a1,a;,…, 而 
概率 分 布 为 P(X= a;)= pi;,i =1,2,…, 则 我 们 仿照 (1.1), 而 把 
X 的 数学 期 望 下 (XX) 定义 为 级 数 之 和 : 

E(X) = Dap, (1.2) 


i=] 


但 当然 ,必须 级 数 收 敛 才 行 , 实 际 上 我 们 要 求 更 多 ,要 求 这 个 级 数 
绝对 收敛 :; 
定义 1.2 如 果 


2 ci| 包 < % (1.3) 
则 称 (1.2) 式 右边 的 级 数 之 和 为 X 的 数学 期 望 


为 什么 不 就 要 求 (1.2) 右 边 收 敛 而 必须 要 求 (1.3)? 这 就 涉及 
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级 数理 论 中 的 一 个 现象 :如 果 某 个 级 数 ,例如 >\a ,只 是 收 伍 
i=1 


( 称 为 条 件 收敛) ,而 其 绝对 值 构 成 的 级 数 > | ai |p; ,并 不 收敛 ， 


则 将 这 级 数 各 项 次 序 改 排 以 后 ,可 以 使 它 变 得 不 收敛 ,或 者 使 它 收 
敛 而 其 和 等 于 事先 任意 指定 之 值 . 这 就 意味 着 (1.2) 右 边 的 和 存在 
与 否 ,等 于 多 少 , 与 随机 变量 X 所 取 之 值 的 排列 次 序 有 关 , 而 
E(X) 作 为 刻画 X 的 某 种 特性 的 数值 ,有 其 客观 意义 ,不 应 与 其 值 
的 人 为 排列 次 序 有 关 . 

在 连续 型 随机 变量 的 情况 ,以 积分 代替 求 和 ,而 得 到 数学 期 望 
的 定义 : 

定义 1.3 设 X 有 概率 密度 消 数 f(xz). 如 果 


| lzlf(z)dr < oo (1.4) 
则 称 
E(X) = | _zr(z)dz (1.5) 
为 X 的 数学 期 望 
这 个 定义 可 以 用 离散 化 的 方式 


来 加 以 解释 . 如 图 3.1, 在 xz 轴 上 用 

密集 的 点 列 1 zx;1 把 二 轴 分 成 很 多 小 

区 间 ,长 为 Xitl Xi = AZx,. 当 入 取 

值 于 区 间 [zi,z+i) 内 时 ,可 近似 地 

认为 其 值 就 是 zx;. 按 密度 函数 的 定 

图 3.1 义 ,X 取 上 述 区 间 内 之 值 的 概率 , 即 

图 中 斜 线 标 出 部 分 的 面积 ,近似 地 为 

f(zi)Ax;. 用 这 个 方式 ,我 们 把 原来 的 连续 型 随机 变量 X 近似 地 

离散 化 为 一 个 取 无 穷 个 值 |x;| 的 离散 型 变量 X ,XX 的 分 布 为 
P(X = xz;) 之 f(z;)Azx;. 按 定义 1.2, 有 


E(X’) ~ 2 xif (xi) Ar; 
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随 着 区 间 Ax; 愈 分 愈 小 ,X 愈 来 愈 接近 XX, 而 上 式 右 端 之 和 也 愈 
来 愈 接近 于 (1.5) 式 右边 的 积分 ,这 样 就 得 出 定义 1.3. 至 于 要 求 
积分 绝对 收敛 即 (1.4) 式 ,其 原因 与 定义 1.2 的 情况 有 所 不 同 ,在 
此 不 能 细 论 了 . 

例 1.1 设 X 服从 波 蛙 松 分 布 P(4)( 见 第 二 章 例 1.2), 则 


i—1 
E(X)= 3 sje = = Ae > C1 1)1 


-ae 和 = he er 一 从 (1.6) 


这 解释 了 波 蛙 松 分 布 Pp(4) 中 参数 4 的 意义 , 拿 第 二 章 例 1.2 的 
情况 来 说 ,A 就 是 在 所 指定 的 时 间 段 中 发 生 事故 的 平均 次 数 . 

例 1.2 设 X 服 从 负 二 项 分 布 ( 见 第 二 章 例 1.3 的 (1.11 ) 
式 ), 则 


EOO = pO py (17) 


为 求 这 个 和 ,我 们 要 用 到 在 第 一 章 例 1.5 中 指出 过 的 负 指 数 二 项 
展开 式 
i+r—-l\. 
(1—zx)” = > | " jz 
两 边 对 工 求 导 ,得 
r(1 一 工 ) -一 = > - ] ja 
在 上 式 中 令 z=1- pp, 然后 两 边 同 乘 1- p 得 到 
2 -py = yp -D1 p) 
而 
E(X) = pr :rp "(1-p)=r(l-p)/p (1.8) 
Pp 意 小 , 则 此 值 人 鳄 大 ,这 是 自然 的 : 阁 事 件 A 的 概率 p 很 小 , 则 等 
待 它 出 现 r 次 的 平均 时 间 也 就 愈 长 , 当 r=1 时 ,得 到 几何 分 布 
(第 二 章 (2.12) 式 ) 的 期 望 为 (1 一 pp)/p. 
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例 1.3 若 久 服从 [a,bj] 区 间 的 均匀 分 布 (第 二 章 例 1.9), 则 
E(X)= | zdz = (a + 已) (1.9) 


即 期 望 为 区 间 中 后, 这 在 直观 上 很 显然 . 
例 1.4 若 关 服从 指数 分 布 (第 二 章 例 1.7,(1.20) 式 ), 则 


E(X)= | re “dx = 2 | ze™dr = A IT(2)= A 


(1.10) 
这 个 结果 的 直观 解释 曾 在 第 二 章 例 1.7 中 指出 过 . 
例 1.5 设 XX 服 从 正 态 分 布 NCu,o”), 则 


E(X) = | zexp” dz 
V 20 -~ 
作 变 数 代 换 X= 二 4+ot, 化 为 
E(X)= | Cy + ot)e 2dt 


w 2X 
1 | -1 /2 1 | -#2 
二 e dt+o te dt 
A a 纪元 — Co A 二 — OO 


上 去 右边 第 一 项 为 ,第 二 项 为 0. 因此 
E(X)= nu (1.11) 
这 样 ,我 们 得 到 了 正 态 分 布 N(y,o”) 中 两 个 参数 之 一 的 wx 的 解 
释 :;y 就 是 均值 ,这 一 点 从 直观 上 看 很 清楚 ,因为 N(y,o?) 的 密度 
明 数 关于 yx 点 对 称 ( 见 第 二 章 图 2.2b) ,其 均值 自 应 在 这 个 点 ， 
因为 数学 期 望 是 由 随机 变量 的 分 布 完 全 决定 的 ,故我 们 可 以 
而 且 常 常 说 某 分 布下 的 期 望 是 多 少 , 某 密度 f 的 期 望 是 多 少 等 . 
期 望 是 通过 概率 分 布 而 决定 这 个 事实 ,可 能 会 被 理解 为 :在 任何 应 
用 的 场合 , 当 谈 到 某 变量 X 的 期 望 时 ,必须 知道 其 分 布 ,这 话 不 完 
全 确切 .在 有 些 应 用 问题 中 ,人 们 难于 决定 有 关 变 量 的 分 布 如 何 ， 
甚至 也 难于 对 之 提出 某 种 合理 的 假定 ,但 有 相当 的 根据 (经 验 的 或 
理论 的 ) 对 期 望 值 提出 一 些 假定 甚至 有 不 少 了 解 .例如 ,我 们 可 能 
比较 确切 地 知道 某 行 业 工 人 的 平均 工资 ,而 对 工资 的 分 布 情况 并 
不 很 清楚 .另外 , 当 需 要 通过 观察 或 试验 取得 数据 以 进行 估计 时 ， 
"114 。 


去 估计 一 变量 的 期 望 ,要 比 去 估计 其 分 布 容易 且 更 确切 ,因为 期 型 
只 是 一 个 数 而 分 布 (或 密度 ) 是 一 个 函数 .以 上 所 说 对 其 他 的 数字 
特征 也 成 立 . 在 本 书后 面 讲 到 数理 统计 学 时 将 更 明白 这 一 点 . 


3.1.2 ”数学 期 望 的 性 质 


数学 期 望 之 所 以 在 理论 和 应 用 上 都 极为 重要 ,除了 它 本 身 的 
含义 (作为 变量 平均 取 值 之 刻画 ) 外 ,还 有 一 个 原因 , 即 它 具有 一 些 
恨 好 的 性 质 ,这 些 性 质 使 得 它 在 数学 上 很 方便 .本 段 就 是 讨论 这 个 
问题 ， 

定理 1.1 者 干 个 随机 变量 之 和 的 期 望 ,等 于 各 变量 的 期 望 
之 和 , 即 

E(Xi1+ XX», 十 … 十 Xn) 三 下 (XI1) 十 五 (X2) + + E(X,) 
(1.12) 
当然 ,这 里 要 假定 各 变量 X; 的 期 望都 存在 . 
证 先 就 n=2 的 情况 来 证 ,大 A1， 及 ? 为 离散 型 ,分 别 以 2C1， 
ca2,，…… 和 b1 ,pp 记 Xi 和 和 六， 的 一 切 可 能 值 ,而 记 其 分 布 为 
P(X! = a,, X, = b;) = pis,1,7 = 1,2,… (1.13) 
当 入 1 三 a;, X= 6b 时 ,有 X11 二 + 义 ; 二 a; 十 4b;. 故 
下 (Xi 十 X2 1) 一 2 (ai 十 b;) pi; 一 Daips 十 Dbipsy. 
(1.14) 
先 看 第 一 项 , 据 第 二 章 (2.8) 式 ,有 
P(X! = ai) = Dps 
所 以 , 按 定 义 1.2, 有 
Daips 一 va 2 ps 三 2vaiP(Xi = ai) = 下 (X1) 
同 理 ,(1.14) 右 边 第 二 项 为 E(X,). 这 证 明了 所 要 结果 . 
各 (Xi,X2) 为 连续 型 ,以 F(zli,zo) 记 其 联合 密度 , 按 第 二 章 


(4.16) 式 , 知 Xi+ Xs 的 密度 函数 为 (>) = | f(z,y-z)dx ， 
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故 按 定义 1.3, 有 
E(X! + X2) 三 | wo)dy = | | rz — r)drdy 


= | (| zs 一 z)dy jdz 
在 里 面 那个 积分 作 变 数 代 换 y= x+: ,得 


E(X, + X,)= | | 4) f(rot)drdi 


一 避 D 一 站 


一 | [f(zs Dard 十 | | rzsodrdt 


CD 一 一 2 一 


(1.15) 


按 第 二 章 (2.9) 式 , 知 | ”f(z,z)dz 就 是 Xi 的 密度 函数 .所 以 ， 
(1.15) 右 边 第 一 个 积分 等 于 


[x (| 7z,odz)az 一 | zpn(z)dz = E(X,) 


同 理 证 明 第 二 个 积分 为 E(X,), 于 是 证 得 了 所 要 的 结果 . 
一 般 情况 可 用 归纳 的 方式 得 到 .例如 , 记 Y= Xl+XX,, 有 
E(X1+ X;+ Xs3)= E(Y + X;3) = E(Y) + E(X;) 
= E(X1) + E(X,) + E(X;) 


等 等 .定理 1.1 证 毕 . 
定理 1.2 若干 个 独立 随机 变量 之 积 的 期 望 , 等 于 各 变量 的 
期 望 之 积 ; 


E(X1X2°*X,) = E(XI)E(X):…E(X,) 
当然 ,这 里 也 要 假定 各 变量 X; 的 期 望都 存在 . 

证 与 定理 1.1 相似 ,只 须 对 n=2 的 情况 证 明 即 可 . 先 设 
X1,X, 都 为 离散 型 ,其 分 布 为 (1.13). 由 独立 性 假定 知 p; = 
P(X1=a;)P(X,= 6b,). 

因为 当 Xl=a;,X，=b; 时 有 XI1X,= ajb;, 故 

116 。 


E(XiX2) = at 二 abP(X) = ai)P(X2 = b;) 


= -Dap = = a; OP X2 = 与) 


= 下 (XI1) 五 (X2) 
如 所 和 欲 证 . 若 (Xi1,X2) 为 连续 型 , 则 因 独 立 性 ,其 联合 密度 f(x1， 
Xx2) 等 于 各 分 量 密度 fi1 (x1) 与 户 (z2) 之 积 , 故 


oo 


E(X1X,) 一 | zizar(z ,2)dzid>z， 


-OO 


一 | zifiC(z)dr| zaPCza)dzs 
= E(X1)E(X,) 
细心 的 读者 可 能 会 注意 到 ,在 后 一 段 证 明 中 我 们 是 从 公式 


on 


E(XIX;,) = | zix2fCz1,z2)dzridz, (1.16) 


出 发 ,而 这 公式 并 非 直 接 从 期 望 的 定义 而 来 , 它 也 需要 证 明 .因此 ， 
更 严格 的 证 法 应 如 定理 1.1 那样 , 先 推导 出 XX, 的 密度 g, 计 算 


| ”se(z)dz 再 通过 积分 变数 代 换 .这 不 难 做 到 ,我 们 把 它 放 在 


习题 里 留 给 读者 去 完成 (习题 21). 

读者 也 许 还 会 问 : 在 以 上 两 个 定理 中 , 如果 一 部 分 变量 为 离散 
型 ,一 部 分 为 连续 型 ,结果 如 何 ? 答案 是 结论 仍 成 立 . 对 乘积 的 情 
况 ,由 于 有 独立 假定 ,证 明 不 难 . 对 和 的 情况 则 要 用 到 高 等 概率 论 ， 
这 些 都 不 在 此 细 讲 了 . 

要 注意 到 和 定理 1.2 和 1.1 之 间 的 区 别 :后 者 不 要 求 变 量 有 独 
立 性 .读者 也 可 以 思考 一 下 这 个 问题 :如 果 说 ,事件 积 的 概率 的 定 
理 (第 一 章 定理 3.3) 与 此 处 定理 1.2 完全 对 应 ,那么 ,为 什么 事件 
和 概率 的 定理 (第 一 章 定理 3.1) 与 此 处 的 定理 1.1 并 不 完全 对 应 
(概率 加 法 定理 中 有 互 太 要 求 而 定理 1.1 无 任何 要 求 ) ,道理 何在 ? 

定理 1.3( 随 机 变量 函数 的 期 望 ) 设 随机 变量 X 为 离散 型 ， 
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”有 分 布 PCXK= au ) 二 请,i12,…, 或 者 为 连续 型 ,有 概率 密度 函 
数 F(z). 则 
E(g(X)) = Dg(ai)pi( 当 2 |g(ai)|p: < oo 时 


(1.17) 
或 
E(g(X) =| g(a)f(z)dz (| lelz)| f(r)dr < mH) 
(1.18) 


这 个 定理 的 实质 在 于 :为 了 计算 X 的 某 一 函数 g(X) 的 期 望 ， 
并 不 需要 先 算出 g(XX) 的 密度 函数 ,而 可 以 就 从 X 的 分 布 出 发 ， 
这 当然 大 大 方便 了 计算 ,因为 在 g 较为 复杂 时 ,g(X) 的 密度 很 难 
求 . 

证 ”离散 型 情况 (1.17) 好 证 ,因为 P(X=a;)=p,, 有 P(g 
(X)=g(a;))=p; (g(al),g(a;),… 中 可 以 有 相 重 的 ,但 这 并 
不 影响 下 面 的 证 明 ). 由 此 立即 得 出 (1.17). 

连续 型 情况 较 复 杂 ,我 们 只 能 就 g 为 严格 上 升 并 可 导 的 情况 
给 出 证 明 . 按 第 二 章 (4.2) 式 ,这 时 Y = g(XX) 的 密度 函数 为 f(h 
(y))h(y), 其 中 有 为 g 的 反 函 数 , 即 h(g(x))=xz. 此 式 两 边 对 
工 求 导 , 得 h(y)| ,yg (Tz)=1, 即 h'(g(z))=1/g (zx). 因此 


FE(g(X)) = | yf (yh Cy)dy 


作 积 分 变数 代 换 y= g (zx), 注意 到 f(h(g(x)))= f(x),h’(g 
(x))=1/g (x) 及 dy=g (x)dx, 得 


E(g(X)) = | g(r)f(r)dz 


即 (1.18). 一 般 情况 (g 非 单调 ) 的 证 明 超 出 本 书 范围 之 外 ,但 对 有 
些 简单 情况 ,g(X) 虽 非 单 调 , 但 g(X) 的 密度 不 难 求 得 ,这 时 
(1.18) 也 不 难 证 .有 几 种 这 样 的 情况 作为 习题 留 给 读者 . 
本 定理 的 一 个 重要 特例 是 
系 1.1 若 c 为 常数 , 则 
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E(cX) = cE(X) (1.19) 
证 明 由 取 g(x)= cz 得 出 .当然 ,直接 证 明 也 很 容易 . 
这 几 个 定理 无 论 在 理论 上 和 实用 上 都 有 重大 意义 ,这 里 我 们 
举 几 个 例子 说 明 其 应 用 . 
例 1.6 设 针 服从 二 项 分 布 B(n,p), 求 E(X). 
此 例 不 难 由 定义 1.1 直接 计算 ,但 如 下 考虑 更 简单 : 因 X 为 7 
次 独立 试验 中 某 事 件 A 发 生 的 次 数 , 且 在 每 次 试验 中 A 发 生 的 
概率 为 p. 故 如 引进 随机 变量 Xi ,…,X, ,其 中 
x - 1， 若 在 第 i 次 试验 时 事件 A 发 生 (1.20) 
1 0， 若 在 第 i 次 试验 时 事件 A 不 发 生 
则 Xi，……,X, 独立 , 且 
及 二 及 [十 … 十 用， (1.21) 
按 定理 1.1 有 ,E(X)=E(Xi1) 十 … 二 玉 (X,). 为 计算 E(X,), 注 
意 按 定义 (1.20),X; 只 取 两 个 值 1 和 0, 其 取 1 的 概率 为 户 , 取 0 
的 概率 为 1 一 pp. 因 而 E(X;)=1xp+0x(1 一 p)=p. 由 此 得 到 
E(X)= np (1.22) 
这 比 直接 计算 要 简单 些 ,又 注意 : 在 上 述 论 证 中 并 未 用 到 X1，- 
X, 独立 这 一 事实 . 
例 1.7 再 考虑 第 一 章 例 2.2 那个 “n 双 鞋 随机 地 分 成 n 堆 ” 
的 试验 ,以 记 “ 恰 好 成 一 双 ” 的 那 种 堆 的 数目 , 求 EE(X). 
此 题 知 要 直接 用 定义 1.1, 就 须 计 算 P(X=7i), 即 “恰好 有 i 
个 堆 各 自 成 一 双 的 概率 .这 个 概率 计算 不 易 , 但 使 用 上 例 的 方法 
不 难 求解 :引进 随机 变量 Xi ,… ,X, ,其 中 
1， 车 第 i 堆 的 两 只 恰 成 一 双 
0， 敬 第 i 堆 的 两 只 不 成 一 双 
则 仍 有 X=Xi+…+X, 且 下 (X)=POX=1)= 忆 (第 ; 堆 恰 成 
一 双 ) .为 算 这 个 概率 ,我 们 取 如 下 的 分 堆 方法 : 先 把 2n 只 鞋 随机 
地 目 左 至 右 排 成 一 列 ,然后 让 排 在 1,2 位 置 的 成 一 堆 ,3,4 位 置 的 
为 第 二 堆 , 等 等 . 总 的 排列 方法 有 (2n)! 种 .有 利于 事件 { 第 ; 堆 
怡 成 一 双 } 的 排 法 可 计算 如 下 :第 i 堆 占 据 排 列 中 的 第 (2i 一 1) 和 
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第 2; 号 位 置 .第 (2i - 1) 号 位 置 可 以 从 2n 只 鞋 中 任 取 一 只 ,有 
2n 种 取 法 .这 只 定 了 以 后 ,为 使 恰 成 一 双 , 第 2i 号 位 置 就 只 有 一 
种 取 法 . 取 好 后 , 剩 下 的 22 一 2 只 则 可 任意 排 ,有 (2n 一 2)! 种 排 
法 .因此 ,有 利于 上 述 事件 的 总 排列 数 为 2 .1.(22 一 2)1, 而 所 求 
的 概率 为 

2n(2n ~ 2)1/(2n)! = 1/(2n — 1) 
此 即 为 E(X;), 而 E(X)=E(Xi1)+-…+E(X,)=n/(2n-1) 

例 1.8 试 计算 “统计 三 大 分 布 ” 的 期 望 值 . 

对 目 由 度 x 的 卡 方 分 布 ,直接 用 其 密度 函数 的 形式 (第 二 章 
(4.26)),T 了 函数 的 公式 (第 二 章 (4.23)) 及 数学 期 望 的 定义 1.3， 
不 难 算出 其 期 望 为 n. 上 略 简单 一 些 是 用 第 二 章 例 4.9, 把 XX 表 为 
XT 二 +… 十 XX ,XX1，,… ,XX 独立 且 各 服从 标准 正 态 分布 N (0,1). 按 
定理 1.3, 有 

2 


E(X?) = 坟 -| 72e-z 7 一 万 -|， ez 7247 
. A 一 如 A 


把 er 2272dx 写 为 — rd(e-*22) ,用 分 部 积分 ,得 到 

| ede 一 | ear 一 二 | ez2dz = V2r [2 
后 一 式 用 第 二 章 (1.15). 于 是 得 到 E(X?)=1, 而 E(X)=E(X?) 
+°%%*+E(X%)=n. 

对 自由 度 n 的 z 分 布 ,由 于 其 密度 函数 (第 二 章 (4.31) 式 ) 关 


于 0 对 称 , 易 见 其 期 望 为 0. 但 是 有 一 个 条 件 , 就 是 自由 度 ”必须 
大 于 1. 这 是 因为 


| izla 十 z2/n) 3 dx =00 当 n=1 
因而 条 件 (1.4) 不 适合 , 当 n >1 时 上 式 的 积分 有 限 . 


对 目 由 度 为 m,n 的 下 分 布 , 写 


1 1 _ 
及 一 Lx,/ 了 Xi 一 mm 177X >/X 1 


其 中 Xi,X2 独立 ,分 别 服从 分 布 Xx 和 X%. 由 于 Xi,X, 独立 , 按 
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第 二 章 定理 3.3, 知 Xi! 入; 也 独立 , 故 按 定理 1.2, 有 

E(X) = minE(X,)E(XT') 二 m 1nmE(X7r') 一 nE (Xi!) 
(1.23) 

于 是 问题 归结 为 计算 (XT1!). 按 定理 1.3, 有 


一 1 reo 
E(Xi!)= (2"2T (再 ) | > 一 1 ee 一 工 / T7422- 1d7 


中 
= (22 


一 1 ooc 
| e X27 (n—2) 人 /2— lz 


| 
) ln- (号 -1 


-203 -全 
-直人 -人 [全 -9r( 且 -9 


一 一 2) 
由 此 及 (1.23) , 知 
E(X) = zz -2) (X~ F,,) (1.24) 
此 式 只 在 n >2 时 才 有 效 . 当 n=1,2 时 ,下 ,, ,的 期 望 不 存在 . 


3.1.3 条 件数 学 期 望 (条 件 均 值 ) 


与 条 件 分 布 的 定义 相似 ,随机 变量 Y 的 条 件数 学 期 望 ,就 是 
它 在 给 定 的 某 种 附加 条 件 之 下 的 数学 期 望 .对 统计 学 来 说 ,最 重要 
的 情况 是 :在 给 定 了 某 些 其 他 随机 变量 X ,Z ,… 等 的 值 x ,z,… 等 
的 条 件 之 下 ,Y 的 条 件 期 望 , 记 为 E(Y|XX=x,Z=z,…). 以 只 有 
一 个 变量 X 为 例 , 就 是 EU(YIX=z). 在 X 已 明确 而 不 致 引起 误 
解 的 情况 下 ,也 可 简 记 为 E(Y|x). 

如 果 知 道 了 (X,Y) 的 联合 密度 , 则 EF(Y|z) 的 定义 就 可 以 具 
体 化 为 : 先 定 出 在 给 定 X=z 之 下 ,Y 的 条 件 密 度 函 数 fyjz)， 
然后 按 定 义 1.3 算出 


E(Ylz)=| yf(ylz)dy (1.25) 


| 
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如 果 说 ,条 件 分 布 是 变量 X 与 Y 的 相依 关系 在 概率 上 的 完全 
刻画 ,那么 ,条 件 期 望 则 在 一 个 很 重要 的 方面 刻画 了 二 者 的 关系 ， 
它 反映 了 随 着 X 取 值 z 的 变化 ,Y 的 平均 变化 的 情况 如 何 , 而 这 
常常 是 研究 者 所 关心 的 主要 内 容 .例如 , 随 着 人 的 身高 zx 的 变化 ， 
具 身 高 x 的 那些 人 的 平均 体重 的 变化 情况 如 何 ; 随 着 其 受 教育 年 
数 过 的 变化 ,其 平均 收入 的 变化 如 何等 等 .在 统计 学 上 , 浓 把 条 件 
期 望 E(Y|z) 作 为 xz 的 函数 称 为 Y 对 XX 的 “回归 函数 ”( 回 归 这 
个 名 词 将 在 第 六 章 中 解释 ) ,而 “回归 分 析 ”, 即 关于 回归 了 尔 数 的 统 
计 人 研究 ,构成 统计 学 的 一 个 重要 分 支 . 

例 1.9 条 件 期 望 的 一 个 最 重要 的 例子 是 (X,Y) 服 从 二 维 正 
态 分 布 N(a ,5 ,ai,cat,o). 根 据 第 二 章 例 3.3, 在 给 定 X=>z 时 Y 
的 条 件 分 布 为 正 态 分 布 NCB+ pozorl(z-a),coi(1-o2)). 因 为 
正 态 分 布 N(y ,co) 的 期 望 就 是 y, 故 有 

z E(Y|zx) = b+po2017 (XT—a) (1.26) 
它 是 z 的 线性 函数 .如 果 p>0, 则 EE(Y|z) 随 zz 增加 而 增加 , 即 
Y 平均 说 来 有 随 X 的 增长 而 增长 的 趋势 ,这 就 是 我 们 以 前 提 到 
的 正 相关 的 解释 . 若 p<0, 则 为 负 相 关 , 当 p=0 时 ,XX 与 Y 独 
立 ,E(YY |z) 当 然 与 z 无 关 . 

从 条 件数 学 期 望 的 概念 ,可 得 出 求 通常 的 (无 条 件 的 ) 数 学 期 
望 的 一 个 重要 公式 .这 个 公式 与 计算 概率 的 全 概率 公式 相当 .回想 
全 概率 公式 P(A) = 2 ,P(B;)P(A1B;). 它 可 以 理解 为 通过 事 
件 A 的 条 件 概率 P(A1B;) 去 计算 其 (无 条 件 ) 概 率 P(A ). 更 确定 
地 说 ,P(A ) 就 是 条 件 概 率 P(A 1B,) 的 某 种 加 权 平 均 , 权 即 为 事件 
B; 的 概率 . 以 此 类 推 ,变量 Y 的 (无 条 件 ) 期 望 , 应 等 于 其 条 件 期 
望 E(Y1|z) 对 之 取 加 权 平 均 ,x 的 权 与 变量 X 在 x 点 的 概率 密度 
i(z) 成 比例 , 即 : 


E(Y) = | ECrlz)P(z)dz (1.27) 


此 式 很 容易 证 明 : 以 f(z,y) 记 (X,Y) 的 联合 密度 函数 , 则 X,Y 
的 (边缘 ) 密 度 函 数 分 别 为 
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f(z) = 人 may)ay 和 Po) = | (zy)dz 
按 定 义 , E(Y) = | 3 万 (?)dqy, 可 写 为 
E(Y)=| | ylr,y)drdy 
= | [| Cz,y)dy Jdz 


由 于 E(Ylz) = | yf(z,y)dy/f(z), 有 | yf(x1y)dy = 


EC(YIz) 方 (rz) ,而 上 式 转化 为 (1.27). 
公式 (1.27) 可 给 以 另 一 种 写法 , 记 g(xz)= 瑟 (Yi|z), 它 是 工 
的 函数 , 则 (1.27) 成 为 


E(Y)=| _g(z)7i(z)dz (1.28) 


但 据 (1.18), 上 式 右 边 就 是 El(g(X)). 从 g(xz) 的 定义 ,gl 处 ) 是 
E(Y|x)|,_x, 可 简写 为 E(Y|X). 于 是 由 (1.28) 得 
E(Y) = E[E(Y|X)|] (1.29) 
这 个 公式 可 以 形象 地 叙述 为 :一 个 变量 Y 的 期 望 ,等 于 其 条 件 期 
望 的 期 望 .下 (YX) 这 个 符号 的 意义 ,从 上 面 的 叙述 中 已 明确 交代 
了 ,只 须 记 住 :在 求 E(Y|X) 时 , 先 设 定 X 等 于 一 固定 值 x,x 无 
随机 性 ,这 样 可 算出 E(Y|z), 其 表达 式 含 zx, 再 把 xz 换 成 X 即 
得 . / 
公式 (1.29) 虽 可 算是 概率 论 中 一 个 比较 高 深 的 公式 , 它 的 实 
际 含义 其 实 很 简单 : 它 可 理解 为 一 个 “分 两 步 走 ”去 计算 期 望 的 方 
法 .因为 在 不 少 情况 下 , 运 直 计算 E(Y ) 较 难 , 而 在 限定 某 变量 X 
之 值 后 ,计算 条 件 期 望 下 (Yjz) 则 较 容 易 .因此 我 们 分 两 步 走 : 第 
一 步 算出 E(Y|zx), 再 借助 X 的 概率 分 布 ,通过 E(Y|z) 算 出 
E(Y). 更 直观 一 些 ,你 可 以 把 求 E(Y) 看 成 为 在 一 个 很 大 的 范围 
求 平均 .限定 XX 之 值 从 这 个 很 大 的 范围 内 界定 了 一 个 较 小 的 部 
分 . 先 对 这 较 小 的 部 分 求 平均 ,然后 再 对 后 者 求 平均 .比如 要 求全 
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校 学 生 的 平均 身高 ,你 可 以 移 求 出 每 个 班 的 学 生 的 平均 号 高 ,然后 
再 对 各 班 的 平均 值 求 一 次 平均 .自然 ,在 作 后 一 平均 时 ,要 考虑 到 
答 班 人 数 的 不 同 ,是 以 各 班 人 数 为 权 的 加 权 平 均 . 这 个 权 的 作用 相 
当 于 公式 (1.27) 中 的 亡 (z). 

公式 (1.29) 虽 来 自 (1.27), 但 因为 其 形式 并 不 要 求 对 X,Y 
有 特殊 的 假设 , 故 可 适用 于 更 为 一 般 的 情形 . 例如 ,X 不 必 是 一 维 
的 ,如 果 X 为 n 维 随机 向 量 (Xi,…，,X,), 有 概率 密度 f(x ,…， 
Xn) , 则 公式 (1.29) 有 形式 


E(Y) 一 | | ECY leo, ci) f(r )dridz, 


(1.30) 
这 里 E(Y1zxi1,…,z; ) 就 是 在 XX! = x1,…, 义 , = x, 的 条 件 下 ,YY 
的 条 件 期 望 ,又 X,Y 都 可 以 是 离散 型 的 .例如 , 设 X 为 一 维 离散 
型 变量 ,有 分 布 
P(X=ai)= 记 =1,2,… 
则 公式 (1.29) 有 形式 


E(Y) = DpE(Y|a,) (1.31) 


3.1.4 中 位 数 


刻画 一 个 随机 变量 X 的 平均 取 值 的 数学 特征 ,除了 数学 期 望 
以 外 ,最 重要 的 是 中 位 数 . 
定义 1.4 设 连续 型 随机 变量 X 的 分 布 函数 为 F(x), 则 满 
足 条 件 
P(X 过 mm)= F(m)= 1 (1 .32) 
的 数 m 称 为 X 或 分 布下 的 中 位 数 . 
由 于 连续 型 变量 取 一 个 值 的 概率 为 0,P(X= m)=0, 由 
(1.32) 知 
PIX<m)= P(X<m)= P(X>m)= P(X>m)= 17 
就 是 说 ,mm 这 个 点 把 X 的 分 布 从 概率 上 一 切 两 半 ; 在 m 左边 ( 包 
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括 点 m 与 否 无 所 谓 ) 占 一 半 ,m 右边 也 占 一 半 , 从 概率 上 说 ,m 这 
个 点 正好 居于 中 央 ,这 就 是 "中 位 数 得 名 的 由 来 . 

在 实用 上 ,中 位 数 用 得 很 多 ,特别 有 不 少 社 会 统计 资料 , 常 拿 
中 位 数 来 刻画 某 种 量 的 代表 性 数值 ,有 时 它 比 数学 期 望 更 说 明 问 
题 .例如 , 某 社区 内 人 的 收入 的 中 位 数 告 诉 我 们 ;有 一 半 的 人 收入 
低 于 此 值 , 男 一 半 高 于 此 值 .我 们 直观 上 感觉 到 这 个 值 对 该 社区 的 
收入 情况 ,的 确 很 具 代 表 性 . 它 和 期 望 值 相 比 它 的 一 个 优点 是 : 它 
受 个 别 特大 或 特 小 值 的 影响 很 小 ,而 期 望 则 不 然 .举例 而 言 , 若 该 
社区 中 有 一 人 收入 在 百 万 元 以 上 , 则 该 社区 的 均值 可 能 很 高 ,而 绝 
大 多 数 人 并 不 富裕 ,这 个 均值 并 不 很 有 代表 性 . 中 位 数 则 不 然 : 它 
不 受 少 量 这 种 特大 值 的 影响 . 

从 理论 上 说 ,中 位 数 与 均值 相 比 还 有 一 个 优点 , 即 它 总 存在 ， 
而 均值 则 不 是 对 任何 随机 变量 都 存在 ， 

里 则 中 位 数 有 这 些 优点 ,但 在 概率 统计 中 ,无 论 在 理论 和 应 用 
上 ,数学 期 望 的 重要 性 都 超过 中 位 数 ,其 原因 有 以 下 两 方面 ， 

一 是 均值 其 有 很 多 优良 的 性 质 , 反 映 在 前 面 的 定理 1.1 一 
1.3. 这 些 性 质 使 得 在 数学 上 处 理 均 值 很 方便 .例如 ,EF(X| ++ 义 ,) 
=(X1)+ EE(X;), 这 公式 既 简 单 又 毫 无 条 件 ( 除 了 均值 存在 以 
外 ) .中 位 数 则 不 然 :XI+X， 的 中 位 数 , 与 Xi1,X2 各 目的 中 位 数 
之 间 ,不 存在 简单 的 联系 ,这 使 中 位 数 在 数学 上 的 处 理 很 复杂 且 不 
方便 . 

二 是 中 位 数 本 身 所 固有 的 某 些 缺 点 .首先 ,中 位 数 可 以 不 唯 
一 .例如 ,考察 图 3.2 的 密度 函数 f. 它 只 在 两 个 分 开 的 区 间 (a， 
6) 和 (c,d) 内 不 为 0, 晶 在 这 两 段 区 间 上 围 成 的 面积 都 是 1/2. 这 
时 , 按 中 位 数 的 定义 1.4, 区 间 [5,c] 中 任何 一 点 mm 都 是 中 位 数 
它 没 有 一 个 唯一 的 值 . 

次 一 个 问题 是 :在 X 为 离散 型 的 情况 , 虽 也 可 以 定义 中 位 数 
(其 定义 与 定义 1.4 有 所 不 同 ), 但 并 不 很 理想 ,不 完全 符合 “中 位 ” 
这 名 词 所 应 有 的 含义 .考察 一 个 简单 例子 , 设 X 取 三 个 值 1,2,3， 
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P(X = 1)= 2/7,P(X = 2) = 4/7,P(X =3)=17 
这 时 就 不 存在 一 个 点 ,使 m 两 边 的 概率 恰好 一 样 ,不 得 已 只 好 
退 而 求 其 次 ; 找 一 个 点 m ,使 其 左右 两 边 的 概率 差距 最 小 ,在 本 例 
中 这 个 点 是 2. 从 2 这 个 位 置 看 ,左边 的 概率 (2 人 7) 要 比 右边 的 概 
率 (1 人 7) 大 . 故 并 不 是 理想 的 “中 位 " 数 . 

例 1.10 正 态 分 布 N(y,o) 的 中 位 数 就 是 ,这 从 N (yp， 
o ) 的 密度 函数 关于 x 点 对 称 可 以 看 出 . 指数 分 布 函数 已 在 第 二 
章 (1.21) 式 中 列 出 , 故 其 中 位 数 x 为 方程 1 一 e。“”=1/2 的 解 , 即 
m 二 (log2)/AA( 本 书 中 ,log 都 是 以 e 为 底 ). 


3.2 方差 与 短 
3.2.1 方差 和 标准 差 


现在 我 们 转 到 本 章 开始 时 提 到 的 另 一 类 数字 特征 ,即刻 画 随 
机 变量 在 其 中 心 位 置 附近 散布 程度 的 数字 特征 ,其 中 最 重要 的 是 
方差 . 

设 随机 变量 X 有 均值 a = F(X). 试 验 中 ,X 取 的 值 当 然 不 一 
定 恰 好 是 a ,而 会 有 所 偏离 .偏离 的 量 X - a 本 身 也 是 随机 的 ( 因 
为 X 是 随机 的 ). 我 们 要 取 这 个 偏离 X 一 a 的 某 种 有 代表 性 的 数 
字 ,来 刻画 这 偏离 即 散 布 的 程度 大 小 如 何 . 我 们 不 能 就 取 义 一 a 的 
均值 ,因为 开 (X-a)= 开 (X)-a=0 一 一 正 负 偏离 彼此 抵消 了 . 
一 种 解决 办 法 是 取 X-a 的 绝对 值 |] X- al| 以 消除 符号 ,再 取 其 
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均值 玉 |X 一 a| ,作为 变量 X 取 值 的 散布 程度 的 数字 特征 . 这 个 
量 瓦 |1X=-cji 叫 做 X( 或 其 分 布 ) 的 “平均 绝对 差 ”是 常用 于 刻画 
散布 度 的 数字 特征 之 一 .但 是 ,由 于 绝对 值 在 数学 上 处 理 甚 不 方 
便 ,人 科 就 考虑 了 另 一 种 作法 : 先 把 (X - a) 平 方 以 消去 符号 ,然后 
取 其 均值 得 E(X- ca), 把 它 作 为 X 取 值 散布 度 的 衡量 .这 个 量 
就 叫做 X 的 “方差 "(方差 :“ 差 "的 “ 方 ”). 
定义 2.1 设 X 为 随机 变量 ,分 布 为 下, 则 
Var(X) = E(X - EX)’ (2.1) 
称 为 XX( 或 分 布下) 的 方差 ,其 平方 根 v Var(X)( 取 正 什 ) 称 为 X 
(或 分 布下) 的 标准 差 . 
暂 记 EX=w .由 于 (X-a) =X2-2cX+aw2, 按 定理 1.1 得 
Var(X)= E(X*) -2aE(X)+a? 
= E(X’)— (EXY (2.2) 
方差 的 这 个 形式 在 计算 上 往往 较为 方便 . 
方差 之 所 以 成 为 刻画 散布 度 的 最 重要 的 数字 特征 ,原因 之 一 
是 它 具 有 一 些 优良 的 数字 性 质 , 反 映 在 以 下 的 几 个 定理 中 . 
定理 2.1 1” 常数 的 方差 为 0， 2” 若 C 为 常数 , 则 Var 
(X+C)=Var(X). 3” 若 C 为 常数 , 则 Var(CX)= C2Var(X ). 
证 1 ” 大义 = 当 数 4a, 则 EE(X)=a, 故 对-E(X)=0, 因 
而 Var( 六)=0. 
2” 因为 E(XX+C)=E(X)+C, 故 
Varl(X +C)= E[(X+C)- (EX+C)P= E[X- EX]? 
= Var(X) 
3 ” 因 C 为 常数 ,有 EE(CX)= CE(X). 故 
Var(CX)= ELCX ~ CE(X)} = CE(X - EXY 
= CVar(X) 
定理 2.2 独立 随机 变量 之 和 的 方差 ,等 于 各 变量 的 方差 之 
和 |: 


、 Var 是 方差 Variance 的 缩写 . 
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Var(XI 二 十 X) = Var(X1) 十 十 Var(X,) (2.3) 


证 记 F(X)=a ii=1 7, 则 因 下 (>)X)= > ai 有 
i=1 = 


Var( Xi 十 … 十 X，) 一 E[ Sx, 一 > 一 E[ Dx, -ai 


二 NEL 一 a;)(X; 一 aj) | 


(2.4) 
有 两 类 项 :一 类 是 i,; 相同 ,这 类 项 , 按 方差 的 定义 , 即 为 Var 
(X ) 另 一 类 项 是 ij 不 同 .这 时 , 因 X, ,X 独立 , 按 定理 1.2 有 
F(XX;)= E(X;)E(X;)= aia;. 所 以 

E[(X;— ai)(X ~ a)|= E(XX) — E(aX)— E(aX;) + aia; 
= QQ 一 ai 一 aai+aai = 0 

这 样 ,在 (2.4) 式 最 后 一 个 和 中 ,只 剩 下 i=j 的 那些 项 . 这 些 项 之 
和 即 (2.3) 式 右边 .因而 证 明了 本 定理 ， 

这 个 定理 是 方差 的 一 个 极 重 要 的 性 质 , 它 与 均值 的 定理 1.1 
相似 .但 要 注意 的 是 :方差 的 定理 要 求 各 变量 独立 ,而 均值 的 定理 
则 不 要 求 . 

例 2.1 设 X 为 一 随机 变量 ,EE(X)=4a 而 Var(X)=o . 记 
Y= (XX 一 a)/o, 则 El(Y)=0, 且 按 定 理 2.1 吻 知 Var(Y)=1. 这 
样 ,对 X 作 一 线性 变换 后 ,得 到 一 个 具 均 值 0、 方 差 1 的 变量 了 . 
常 称 Y 是 X 的 “标准 化 ”. 

例 2.2 设 X 服 从 波 哇 松 分 布 P(A). 求 其 方差 .前 已 求 出 
EF(X) 二 .又 据 定理 1.3, 知 


E(X’) = > i2e Mi/i! 
i=0 


把 六 写 为 i(i 一 1)+i, 注 意 到 》) ie Wi/il 就 是 X 的 均值 , 即 
i=0 


A, 而 i1(1 一 1)/i1 =1/(i 一 2)!, 有 
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FE(X2)= De Mi/(i 一 2)1+A 
i=2 


一 )2 > ee MA 一 2)1 十 和 A 


7 二 了 


= et Si/ + 入 二 Ae er+ 久 = A ++A 
于 是 按 公 式 (2.2) 得 到 Var( 针 ) 二 + 入 一 A“* 二 A. 嗓 波 哇 松 分 布 
P(A ) 的 均值 方差 相同 ,都 等 于 其 参数 4. 

例 2.3 设 久 服从 二 项 分 布 B(n,p), 求 Var(XX). 

把 XX 表 为 (1.21) 的 形式 ,其 中 X, 由 (1.20) 定 义 , 因 为 Xj， 
pp X，， 独立 ,有 Var(X)=Var(Xi)+…+Var(X). 现 计算 
Var(X;). 因 X; 只 取 1,0 两 个 值 ,概率 分 别 为 p 和 1 一 p, 故 

E(X,) 一 p,E(X?) 一 p,1 一 1 ，… ,7 
因而 得 到 Var(X;)= pp* =p(l1 一 ), 而 
Var(X) = np(l1 — p) (2.5) 

本 题 也 可 由 定义 直接 计算 ,但 比 这 麻烦 些 . 

例 2.4 再 考察 例 1.7, 求 该 例 中 变量 X 的 方差 . 

仍 如 该 例 把 X 表 为 XU+…+X,. 麻烦 的 是 ,这 里 XI …X， 
并 非 独 立 ,因而 不 能 用 定理 2.2. 但 这 种 表示 仍 可 简化 计算 ,有 

E(X?) = E( x) = >» E(XX,) (2.6) 
分 两 类 项 ;一 类 是 i =j. 这 类 项 之 和 为 EE(X?) .由 于 X; 只 取 
1,0 两 值 , 故 X= XX, ,因而 
> E(xX?) 一 > ECXI) = E(X) = n/(2n 一 1 


( 见 例 1.7) 
对 ;天 ) , 取 z=1.7=2 为 例 ,其 他 :7 一 样 ,因为 X;,X; 都 只 取 1， 
0 为 值 , 有 
E(X1X,) = P(X = 1,X, = 1) 
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即 “ 第 1,2 堆 都 恰 成 一 双 " 的 概率 .这 概率 计算 的 思想 ,与 例 1.7 中 
六 明 过 的 完全 一 样 ,结果 为 
P(X1 = 1,X; = 1)= 2n: 1: (2n -2):1.:(2n -4)!/2n)! 
= 1/[(2n — 1)(2n - 3)] 
又 在 和 (2.6) 中 ,i 关 j7 的 项 的 个 数 为 n(n 一 1), 故 第 二 类 项 (i 关 ] 
的 项 ) 之 和 为 n(n 一 1)/L(2n 一 1)(2n 一 3)j. 由 此 ,用 公式 (2.2)， 
得 | 
Var(X) = E(X*) — (EX)’ 
= n/(2n m1)+n(n -1)/(2n -1)(2n 一 3)] 
— [n/(2n -1)]* = 4n(n -1)/(2n ~ 1)(2n 一 3) | 
例 2.5 设 义 服从 正 态 分 布 N(y,o ). 注 意 到 玉 (X)=j, 有 
Var(X) = E(X ~— 1)= 万 一 (x 一 1 )2e (4) 2 dx 
作 变 数 代 换 x= y+ oi, 得 


Var(X)= 0o° | 12e- 2di 
V ZA- 


式 中 的 积分 已 在 例 1.8 中 计算 过 ,为 V2x .所 以 
Var(X)= ca (2.7) 
由 此 得 到 正 态 分 布 N(y,o ) 中 男 一 参数 o? 的 解释 : 它 就 是 
分 布 的 方差 . 正 态 分 布 完 全 由 其 均值 4k 和 方差 co2 决定 , 故 也 常 说 
“均值 为 wk 方差 为 o* 的 正 态 分 布 ”. 经 过 标准 化 了 = (X -wz)vc， 
按 例 2.1 得 出 均值 为 0 方差 为 1 的 正 态 分 布 , 即 标准 正 态 分 布 . 
这 一 点 早 在 第 二 章 例 1.6 中 ,通过 直接 计算 分 布 的 方法 证 明 过 (第 
二 章 (1.17) 式 ). 
方差 co 愈 小 , 则 X 的 取 值 以 更 大 
的 概率 集中 在 其 均值 y 附近 ,这 一 点 
也 可 从 如 下 看 出 : 正 态 分 布 N (jy,o?) 
的 密度 函数 在 过 = 点 之 值 ,等 于 
(V2ro) . 它 与 o 成 反比 ;o 愈 小 ,这 
个 值 愈 大 ,而 密度 在 / 点 处 有 一 个 更 
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高 的 峰 ,显示 概率 更 多 地 集中 在 yx 点 附近 , 见 图 3.3. 其 中 男 出 了 
正 态 N(y,o ) 当 o =1 和 o =1/4 时 密度 也 数 的 图 形 . 

例 2.6 指数 分 布 (第 二 章 例 1.7) 的 方差 为 1/4?. 区 间 [a,6。] 
上 的 均匀 分 布 (第 二 章 例 1.9) 的 方差 为 (6 一 a)*/12. 这些 都 容易 
直接 据 公 式 (2.2) 算 出 , 留 给 读者 .在 均匀 分 布 的 情况 ,方差 随 区 间 
[a ,5bj 之 长 5 一 a 的 增 大 而 增 大 ,这 当然 , 因 区 间 长 了 ,散布 的 程 
度 也 就 大 了 . 

例 2.7 求 “ 统 计 三 大 分 布 的 方差 . 

先 考 虑 卡 方 分 布 . 设 六 一 X%. 把 久 表 为 X?+… + X2 ,Xi， 
… ,XX, 独立 同 分 布 且 有 公共 分 布 N(0,1). 有 

Var(X1) = E(X!) -一 [EX = E(X1)-1 


而 
E(X4) = -| re vdr - -让 | re ed 
作 变 数 代 换 zx = v 2: ,有 
E(X1)= 新 2 ecerd - 庆 T(>) 
-人 


故 Var( Xi)=3 一 1=2, 而 Var(X)=2n. 


次 考虑 1 分布. 设 X = x Ix ,Xi,X2 独立 而 X 一 1 ， 
XI 一 NO0,1). 前 已 指出 E(X)=0. 故 由 独立 性 有 

Var(X) = E(X’) = E(Xi)E(n/X,) = nE(1/X,) 
在 例 1.8 中 已 算出 下 (1/X,)=1/An 一 2), 故 Var(X)=n/(n 一 
2),(n>2). 

自由 度 ”的 上 分布 1, 有 期 望 0, 与 标准 正 态 N (0,1) 的 期 望 
同 .其 方差 2 人 2 -2) 大 于 1 但 当 ?” 很 大 时 接近 N(0,1) 的 方差 1 
以 后 将 指出 : 当 ?很 大 时 ,z。 的 分 布 确实 接近 NM(0 ,1)， 

类 似 地 算出 自由 度 mm ,2 的 下 分布 Fo, 的 方差 为 2m2(mm 二 
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n 一 2)/[m(n 一 2)*(n 一 4)]( 当 之 4). 细 节 留 给 读者 . 
3.2.2 和 气 


定义 2.2 设 X 为 随机 变量 ,c 为 常数 ,& 为 正 整数 . 则 量 
下 [(X-=- cc 六] 称 为 X 关 于 c 点 的 & 阶 和 矩 . 
比较 重要 的 有 两 个 情况 : 
1.c=0. 这 时 as= 开 (X) 称 为 X 的 有 阶 原点 矩 . 
2. c= 二 E(X). 这 时 克 = 下 [1(X-EX)] 称 为 的 R 阶 中 心 
矩 . 
一 阶 原点 矩 就 是 期 望 .一 阶 中 心 矩 ki =0, 二 阶 中 心 矩 wo 就 
是 X 的 方差 Var(X). 在 统计 学 上 ,高 于 4 阶 的 矩 极 少 使 用 . 三、 四 
阶 矩 有 些 应 用 ,但 也 不 很 多 . z 
应 用 之 一 是 用 ws 去 衡量 分 布 是 否 有 偏 . 设 X 的 概率 密度 函 
数 为 f( 工 ). 若 了 关于 某 点 a 对 称 , 即 
fla+ x)= Fa 一 工 ) 
如 图 3.4 所 示 , 则 a 必 等 于 EE(X), 且 
143= ELX-E(X)] =0. 如 果 jy3>0， 
则 称 分 布 为 正 偏 或 右 偏 . 如 果 ;<0， 
则 称 分 布 为 负 偏 或 左 偏 . 特别 ,对 正 态 
分 布 而 言 有 jx3 二 0, 故 如 jp 显著 异 于 
图 3.4 0, 则 是 分 布 与 正 态 有 较 大 偏离 的 标 
志 . 由 于 ys 的 因 次 是 X 的 因 次 的 三 次 
方 ,为 抵消 这 一 点 ,以 X 的 标准 差 的 三 次 方 , 即 pw32 去 除 .其 商 
B1 = p3 /12° (2.8) 
应 用 之 二 是 用 /ms 去 衡量 分 布 (密度 ) 在 均值 附近 的 陡峭 程度 
如 何 .因为 y4=ELX-E(X)]1, 容 易 看 出 , 若 义 取 值 在 概率 上 很 
集中 在 E(X) 附 近 , 则 ws 将 倾向 于 小 ,否则 就 倾向 于 大 .为 抵消 尺 
度 的 影响 ,类 似 于 ws 的 情况 ,以 标准 差 四 次 方 即 3 去 除 ,得 
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Bz = pa/p3 (2.9) 
它 称 为 X 或 其 分 布 的 “ 峰 度 系数 ”. 

若 X 有 正 态 分布 NOp,o2), 则 B=3, 与 人 AL 和 co 无 关 . 为 了 迁 
就 这 一 点 ,也 常 定义 jw4/15 一 3 为 峰 度 系数 ,以 使 正 态 分 布 有 峰 度 
系数 0. 

“ 峰 度 "这 个 名 词 , 单 从 表面 上 看 , 易 引 起 误解 .例如 ,我 们 在 例 
2.4 中 已 指出 ,并 由 图 3.3 看 出 ,就 正 态 分 布 N(x,o”) 而 言 ,oo 愈 
小 ,密度 函数 在 x 点 处 “高 峰 就 愈 高 且 愈 陡峭 .那么 ,为何 所 有 的 
正 态 分 布 都 又 有 同一 峰 度 系 数 ? 这 岂 不 与 这 个 名 词 的 直觉 含义 不 
符 ? 原因 在 于 : ws 在 除 以 好 后 已 失去 了 因 次 , 即 与 X 的 单位 无 
关 . 或 者 换 句 话说 ,两 个 变量 X, Y, 谁 的 峰 度 大 ,不 能 直接 比 其 密 
度 图 数 , 而 要 调整 到 方差 为 1 后 再 去 比 . 就 是 说 , 找 两 个 常数 c， 
cy ,使 c1X 和 cy 的 方差 都 为 1, 再 比较 其 密度 的 “陡峭 ”程度 如 
何 . 
在 这 个 共同 的 标准 下 ,“ 峰 度 ” 一 
词 就 好 理解 了 . 不 信和 看 图 3.5. 为 便于 rf N\A 
理解 ,我 们 在 图 中 画 了 两 条 都 以 j 为 二 
对 称 中 心 的 对 称 密 度 曲 线 ,是 峰 的 高 
度 一 样 ,但 方 在 顶峰 处 很 陡 . 而 户 则 图 34 
在 顶峰 处 形成 平台 ,较为 平缓 . 这 样 ， 

在 yx 附近 , 户 的 概率 多 而 fi 的 概率 少 .而 方差 都 为 1, 故 fi 的 “ 尾 
巴 必 比 fo 的 厚 一 些 , 这 导致 其 jw 较 大 , 即 有 较 大 的 峰 度 系数 


3.3” 协 方差 与 相关 系数 


现在 我 们 来 考虑 多 维 随 机 向 量 的 数字 特征 ,以 二 维 的 情况 为 
例 . 设 (X,Y) 为 二 维 随机 向 量 , 义 , Y 本 身 都 是 一 维 随机 变量 ,可 
以 定义 其 均值 方差 ,在 本 节 中 我 们 记 
E(X)= mi,E(Y) = 7 ,Var( 买 ) = of, Var( Y) = O37 
这 些 都 在 上 两 市 中 已 讨论 过 了 ,没有 什么 新 东西 .在 多 维 随 机 向 量 
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中 ,最 有 兴趣 的 数字 特征 是 反映 分 量 之 间 的 关系 的 那 种 量 , 其 中 最 
重要 的 ,是 本 节 要 讨论 的 协 方差 和 相关 系数 . 

定义 3.1 称 玉 [(X~-mi)(Y 一 m2)] 为 X,Y 的 协 方差 ,并 
记 为 Cov(X,Y) . 

协 即 "协同 的 意思 .X 的 方差 是 (X -ma1) 与 (X -zl1) 的 
乘积 的 期 望 ,如 今 把 一 个 X- 和 zi; 换 为 了 -7 其 形式 接近 方差 ， 
(X,Y) 与 义 ,Y 的 次 序 无 关 :Cov(X,Y)=Cov(Y,X). 直 接 由 定 
义 得 到 协 方差 的 一 些 简 单 性 质 . 例 姐 , 若 c1,c2,cs,cs 都 是 常数 ， 
则 

Cov(ciX + cz cs3Y + c4) = clic3Cov(X ,Y) (3.1) 
又 易 知 
Cov(X,Y) = E(XY)-— mm2 (3.2) 
这 些 简 单 性 质 的 证 明 都 留 给 读者 . 

下 面 的 定理 包含 了 协 方差 的 重要 性 质 . 

定理 3.1 1 若 X,Y 独 立 , 则 Cov(X,Y)=0. 

2” [Cov(X,Y)]j 入 ctc;. 等 号 当 且 仅 当 X,Y 之 间 有 严格 
线性 关系 ( 即 存 在 常数 a,b 使 =a+p8X) 时 成 立 . 

证 1 的 证 明 由 定理 1.2 直接 得 出 , 因 据 此 定理 , 当 X,Y 独 
立时 有 EE(XY)= mi 为 证 明 2 ,需要 两 点 预备 事实 ， 

a. 痢 a,b,c 为 常数 ,a >0, 而 二 次 三 项 式 at2+2p+c 对 :; 
的 任何 实 值 都 非 负 , 则 必 有 ac 宇 6”. 

b. 知 随 机 变量 Z 只 能 够 取 非 负 值 ,而 EE(Z)=0, 则 Z=0. 

为 了 不 打 断 此 处 的 讨论 ,我 们 将 这 两 点 事实 的 证 明 放 到 后 面 ， 
现 考虑 

E[z(X— mi)+(Y -m2)] = or? + 2Cov(X,Y)t+ a 
(3.3) 

* ”Cov 是 协 方差 Covariance 的 缩写 . 
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由 于 此 式 左边 是 一 个 非 负 随机 变量 的 均值 , 故 它 对 任何 上 非 负 . 按 
预备 事实 a, 有 
of03 之 [Cov( X,Y)] (3.4) 
进一步 ,如 果 (3.4) 成 立 等 号 , 则 (3.3) 右 边 等 于 (ol1t 土 o，). 土 号 
视 Cov(X,Y)>0 或 <0 而 定 , 为 确定 计 , 暂 设 Cov(X,Y)>0, 则 
(3.3) 右 边 为 (o1t + az) .此 式 在 上 =10= 一 avol 时 为 0. 以 上 = 加 
代入 (3.3), 有 
E[io(X— mi)+(Y- m2)] = 
预备 事实 b, 即 知 10(X-- mm)+(Y 一 my)=0, 因 而 X,Y 之 
间 有 严格 线性 关系 . 
反之 , 砧 X,Y 之 间 有 严格 线性 关系 了 = aX +65, 则 a 二 Var 
(Y)=Var(aX +6)=Var(aX)=a’Var(X)=a’of. 叉 因 m,=E 
(Y)=aE(X)+b=ami+6b5, 有 Y-—-nm=(aXt+6b)~-(ami+b) 
二 a( 久 一 m1). 于 是 
Cov(X,Y)= E[(X—- mi)a(X—- mi)|l= alE(X-— m1)”] 
= ao? 
因此 
[Cov(X,Y)] = aol = of(a’o?) = cic3 
即 (3.4) 成 立 等 号 ,这 就 证 明了 2° 全 部 结论 . 
现 证 明 用 到 的 两 个 预备 事实 .对 a, 注 意 到 若 ac 过 6, 则 az2+ 
2bt + c 二 0 有 两 个 不 同 的 实 根 过, 而 atr* +2bt +c=a(t 一 1) 
(1 一 12). 取 to 使 1j<io<zis, 则 将 有 at$+26bt0+c=a(to 一 +) 
(i0 一 12)<0, 与 at*+2bt +c 对 任何 : 非 负 矛盾 ,这 证 明了 a.b 的 
证 明 很 简单 : 奋 Z 关 0, 则 因 Z 只 能 取 非 负 值 , 它 必 以 一 定 的 大 于 0 
的 概率 取 大 于 0 的 值 ,这 将 导致 E(Z)>0, 与 (2Z)=0 的 假定 不 


A 人 
加 ， 


定理 3.1 给 “相关 系数 ”的 定义 打下 了 基础 . 
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定义 3.2 称 Cov(X,Y)Aacico) 为 X,Y 的 相关 系数 ,并 记 
为 ”Corr( 和 ,了 ). 

形式 上 可 以 把 相关 系数 视 为 “标准 尺度 下 的 协 方差 ”. 协 方差 
作为 (XX 一 m1)(Y 一 m2) 的 均值 ,依赖 于 X,Y 的 度量 单位 ,选择 
适当 单位 使 X,Y 的 方差 都 为 1, 则 协 方差 就 是 相关 系数 .这样 就 
能 更 好 地 反映 X,Y 之 间 的 关系 ,不 受 所 用 单位 的 影响 . 

由 定理 3.1 立即 得 到 ， 

定理 3.2 1 看 X,Y 独 立 , 则 Corr(X,Y)=0. 2 一 1 
< 和 Corr(X ,Y) 委 1, 或 | Corr(X,Y)| 委 1, 等 号 当 且 仅 当 X 和 YY 有 
严格 线性 关系 时 达到 . 

对 这 个 定理 我 们 要 加 以 几 条 重要 的 解释 . 

1. 当 Corr(X ,Y)=0( 或 Cov(X,Y)=0, 一 样 ), 称 X,Y“ 不 
相关 ”. 本 定理 的 1° 说 明 由 X,Y 独立 推出 它们 不 相关 .但 反 过 来 
一 般 不 成 立 :由 Corr(XX,Y)=0 不 一 定 有 X,Y 独立 .下 面 是 一 个 
简单 的 例子 . 

例 3.1 设 (X, 了 ) 服 从 单位 圆 内 的 均匀 分 布 , 即 其 密度 函数 
为 

r 1,， 当 zx*+y<1 
用 第 二 章 公式 (2.9),(2.10) ,容易 得 出 X,Y 有 同样 的 边缘 密度 
困 数 g: 
(x) -人 1-x*， 当 |zx|<1 
号 、\、: 净 
0 ， 当 |z| 宇 1 
这 个 函数 关于 0 对 称 ,因此 其 均值 为 0. 故 E(X)=E(Y)=0, 而 


Cov(X,Y) = E(XY) = | ，， zydzdy = 0 
元 +»y<l 
等 于 其 边缘 密度 之 积 g (x)g(y). 


* Corr 是 相关 Correlation 的 缩写 
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2. 相关 系数 也 常 称 为 “线性 相关 系数 ”. 这 是 因为 ,实际 上 相 
关系 数 并 不 是 刻画 了 X,Y 之 间 一 般 关系 的 程度 ,而 只 是 " 线 
性 关系 的 程度 .这 种 说 法 的 根据 之 一 就 在 于 , 当 且 仅 当 X,Y 有 
严格 的 线性 关系 时 , 才 有 | Corr(X,Y)| 达 到 最 大 值 1. 可 以 容易 举 
出 例子 说 明 : 即 使 X 与 了 有 某 种 严格 的 函数 关系 但 非 线 性 关系 ， 
|Corr( 针 ,YY ) | 不仅 不 必 为 1, 还 可 以 为 0. 

例 3.2 设 X~R(C-1L2,12), 即 区 间 1-12,12] 内 的 均 
分 分 布 ,而 了 = cosX ,Y 与 X 有 严格 函数 关系 .但 因 开 (X)=0, 由 
(3.2) 有 


1 
Cov(X,Y)= E(XY) = E(XcosX) = | TCOsrdz =0 


故 Corr(X,Y)=0. 你 看 ,X,Y 说 是 “不 相关 ”, 它 们 之 间 却 有 着 严 
格 的 关系 了 =cosX .足见 这 样 的 相关 只 能 指 线性 而 言 ,一 超出 这 
个 范围 ,这 个 概念 就 失去 了 意义 . 

3. 如 果 0< | Corr(X,Y)|1<1, 则 解释 为 :X,Y 之 间 有 “一 定 
程度 的 "线性 关系 而 非 严 格 的 线性 关系 .何谓 “一 定 程度 ”的 线性 关 
系 ? 我 们 可 以 用 图 3.6 所 示 的 情况 来 说 明 . 在 这 三 个 图 中 ,我 们 都 
假定 (X,Y) 服 从 所 画 出 的 区 域 A 内 的 均匀 分 布 ( 即 其 联合 密度 
f(z,y) 在 A 内 为 | A 71, 在 A 外 为 0,|A| 为 区 域 A 的 面积 ). 
在 这 三 个 图 中 ,X,Y 都 无 严格 的 线性 关系 ,因为 由 X 之 值 并 不 能 
决定 Y 之 值 .可 是 由 这 几 个 图 我 们 都 能 “感觉 "出 ,X,Y 之 间 存 在 


(a) (Pb) (c) 
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着 一 种 线性 的 趋势 .这 种 趋势 ,在 (a) 已 较 显 著 且 是 正 同 的 (X 增 
加 时 了 倾向 于 增加 ), 这 相应 于 Corr(X,Y) 比 较 显 著 地 大 于 0. 在 
(b) ,这 种 线性 趋势 比 (a) 更 明显 ,程度 更 大 ,反映 |Corr(X,Y)| 比 
(a) 的 情况 更 大 ,但 为 负 向 的 .至 于 (c), 则 多 少 有 一 点 儿 线 性 倾向 ， 
但 已 甚 微弱 :Corr(X ,Y) 虽 仍 大 于 0 但 已 接近 0. 
4. 上 面谈 到 的 “线性 相关 ”的 意义 ,还 可 以 从 最 小 二 乘法 的 角 
度 去 解释 : 设 有 两 个 随机 变量 X,Y, 现在 想 用 XX 的 某 一 线性 函数 
a + bX 来 逼近 了 Y , 问 要 选择 怎样 的 常数 a ,5 ,才能 使 逼近 的 程度 最 
高 ? 这 到 近 程 度 , 我 们 就 用 “最 小 二 乘 ” 的 观点 来 衡量 , 即 要 使 
E[(Y 一 a 一 4X)*] 达 到 最 小 . 
仍 以 i;m2 记 E(X),E(Y),o? 和 0o5 记 Var(X),Var( Y). 
引进 常数 
c=a-(m;— bmi) 
则 
E[(Y -a -bX)]= E[(Y- m2) -6(X- mi) -el 
= of + bof ~ 2bCov(X,Y)+ ce?, 
为 使 此 式 达 到 最 小 ,必须 取 c=0,6b =Cov(X,Y)《o3= 0102Corr 
(X,Y)/of = orlczCorr(X,Y). 这 样 求 出 最 佳 线性 有 逼近 为 ( 记 
p=Corr( X,Y)) 
L(X) = zz — ol 070mi + ol az0X (3.5) 
这 一 通 近 的 剩余 是 
El(Y -LL(X))’]= of + 6?0? ~ 2bCov( X,Y) 
= oj +(oilozo)2ci — 2(al azpo)aliozpo 
= os(1 一 0 ) (3.6) 
如 果 p==+1, 则 EL[(Y 一 L(X))]?=0 而 Y=L(X). 这 时 了 与 
X 有 产 格 线性 关系 ,已 于 前 述 . 若 0< |p|<1, 则 | 6| 愈 接近 1, 剩 
余 愈 小 ,说 明 工 (X) 与 Y 的 接近 程度 愈 大 , 即 X,Y 之 间 线性 关系 
的 程度 愈 大 .反之 ,|o| 傅 小 , 则 二 者 的 线性 关系 程度 愈 小 , 当 
o=0 时 ,剩余 为 ci. 这 时 X 的 线性 作用 已 毫 不 存在 . 因为 , 仅 取 一 
138 。 


个 与 X 无 关 的 常数 mm, 已 可 把 站 逼近 到 5 的 剩余 , 因 己 (Y - 
m2 二 o3. 6 的 符号 的 意义 也 由 (3.5) 得 到 解释 ; 当 o >0 时 ， 
L(X) 中 XX 的 系数 大 于 0, 即 YY 的 最 佳 通 近 4 + 5bX 随 X 增加 而 增 
加 .这 就 是 正 向 相关 .反之 ,o<0 表示 负 向 相关 . 

由 于 相关 系数 只 能 刻画 线性 关系 的 程度 ,而 不 能 刻画 一 般 的 
遇 数 相依 关系 的 程度 ,在 概率 论 中 还 引进 了 另 一 些 相 关 性 指标 ,以 
补救 这 个 缺点 .但 是 ,这 些 指标 都 未 能 在 应 用 中 推 开 . 究 其 原因 , 除 
了 这 些 指标 在 性 质 上 比较 复杂 外 ,还 有 一 个 重要 原因 :在 统计 学 应 
用 上 ,最 重要 的 二 维 分 布 是 二 维 正 态 分 布 . 而 对 二 维 正 态 分 布 而 
言 ,相关 系数 是 X,Y 的 相关 性 的 一 个 完美 的 刻画 ,没有 上 面 指 出 
的 缺点 . 甚 根据 有 两 条 : 

1. 若 (X,Y) 为 二 维 正 态 , 则 即使 允许 你 用 任何 函数 MI(X ) 
去 逼近 Y( 仍 以 EL[(Y 一 M(X))*] 最 小 为 准则 , 那 你 所 得 到 的 最 
佳 表 近 , 仍 是 由 (3.5) 式 决定 的 L(X). 故 在 这 个 场合 ,只 须 考虑 线 
性 逼近 已 足 ,而 这 种 逼近 的 程度 完全 由 相关 系数 决定 . 

2. 当 (X,Y) 为 二 维 正 态 时 ,由 Corr(X,Y)=0 能 推出 X,Y 
独立 . 即 在 这 一 特定 场合 ,独立 与 不 相关 是 一 回 事 . 我 们 前 已 指出 ， 
这 在 一 般 情况 并 不 成 立 . 

第 一 点 的 证 明 超 出 本 书 范围 .第 二 点 则 不 难 证 明 . 事实 上 我 们 
将 验证 : 若 (X,Y) 有 二 维 正 态 分 布 N(a,b,of,o5,p), 则 (Orr 
(X,Y)=p. 而 当 o=0 时 , 按 第 二 章 (2.7) 式 易 知 ,(X,Y) 的 联合 
密度 可 表 为 X,Y 各 自 的 密度 请 (z) 和 f(y) 之 积 ,因而 X,Y 是 
独立 的 . 

为 证 明 此 事 ,注意 到 天 (X)=a,E(Y)=0. 利 用 第 二 章 (2.7) 
式 的 N(a,b,of,05,0) 的 密度 函数 的 形式 .有 

Cov(X,Y) = E[(X-a)(Y—-65)| 


-= 2moa V1-P) | G0) bol- 
( 竺 = _2o(z -a)(y-6) Y=) d 
of G102 0 “> 
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注意 到 


(zx-a) 2o(z -a)(y-— 2) ， ( 必 一 2 六 
0G1 0102 03 
= (£2 ) 1 (Vi-P 2) 
ol G2 
作 变 数 代 换 
1 (2 ey = | y—b 
Vip G1 G2? 了 2 
可 将 上 面 的 重 积分 化 为 


Cov(X,Y)= (xz [vy 1 — oo1u 十 gov | 


2 


“ o2vexp| - “ jdxdv 


因为 
ff 2 2 oo oo 
| wwexp(- < 7 “ javdv= | uce 2du| ue 2dv = 0 


fr co 2 oo 2 
| v?exp[- dudv=| 人 2dz| ve dm = 2r 


得 到 Cov(X,Y)=pozloz. 又 Var(X)=of,Var(Y)= oo. 于 是 
Corr(X,Y) = Cov(X,Y)/(oc102) = p. 


3.4 ”大 数 定理 和 中 心 极限 定理 


在 数学 中 大 家 都 注意 到 过 这 样 的 现象 :有 的 时 候 一 个 有 限 的 
和 很 难 求 ,但 一 经 取 极 限 由 有 限 过 渡 到 无 限 , 则 问题 反而 好 办 . 例 
如 , 乔 要 对 某 一 有 限 范 围 的 z 计 荔 和 
rx; 


TX 
an(z)=1+Zx+3 -+ 村.… 十 攻 
31! ?2 | 


则 在 ”固定 但 很 大 时 ,很 难 求 . 市 一 经 到 极限 , 旭 和 有 简单 的 结果 
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liman (x) =e*. 利 用 这 个 结果 , 当 2 很 大 时 ,可 以 把 er 作为 a, (zz) 
的 近似 值 . 

在 概率 论 中 也 存在 着 这 种 情况 . 如果 Xi,XX;,…, XX, 是 一 些 
随机 变量 , 则 Xi 十 … 十 义 , 的 分 布 ,除了 大 干 例外 , 算 起 来 很 复杂 . 
因而 自然 地 会 提出 问题 ;可 否 利 用 极限 的 方法 来 进行 近似 计算 ? 
事实 证 明 这 不 仅 可 能 , 且 更 有 利 的 是 :在 很 一 般 的 情况 下 ,和 的 极 
限 分 布 就 是 正 态 分 布 .这 一 事实 增加 了 正 态 分 布 的 重要 性 .在 概率 
论 上 ,习惯 于 把 和 的 分 布 收敛 于 正 态 分 布 的 那 一 类 定理 都 叫做 “中 
心 极 限定 理 “. 在 本 证 3.4.2 段 中 我 们 将 列 述 这 类 定理 中 最 简单 ， 
然而 也 是 最 重要 的 一 种 情况 . 

在 概率 论 中 , 另 一 类 重要 的 极限 定理 是 所 谓 “ 大 数 定理 ”. 它 是 
由 概率 的 统计 定义 “频率 收敛 于 概率 "引伸 而 来 .为 描述 这 一 点 ,我 
们 把 频率 通过 一 些 随机 变量 的 和 表示 出 来 . 设 做 了 nn 次 独立 试 
验 , 每 次 观察 某 事件 A 是 否 发 生 . 按 (1.20) 式 定义 随机 变量 X, ,1 
=1,…,n. 则 在 这 n 次 试验 中 事件 A 一 共 出 现 了 XI + 十 X 

pa = (XI1 + + X,)/n = XX, (4.1) 
右 P(A)=p, 则 “频率 趋 于 概率 ”就 是 说 ,在 菜 种 意义 下 ( 详 见 下 
文 ), 当 n 很 大 时 p, 接近 p. 但 p 就 是 X, 期 望 值 , 故 也 可 以 写成 ， 
当 ”很 大 时 X, 接近 于 X; 的 期 望 值 . 

按 这 个 表述 ,问题 就 可 以 不 必 局 限于 X, 只 取 0,1 两 个 值 的 情 
形 . 事 实 也 是 如 此 .这 就 是 较 一 般 情况 下 的 大 数 定理 .“ 大 数 ” 的 意 
思 , 就 是 指 涉及 大 量 数目 的 观察 值 X;, 它 表明 这 种 定理 中 指出 的 
现象 ,只 有 在 大 量 次 数 的 试验 和 观察 之 下 才能 成 立 .例如 ,一 所 大 
学 可 能 包含 上 万 名 学 生 , 每 人 有 其 身高 . 如 果 我 们 随意 观察 一 个 学 
生 的 号 高 XX1, 则 Xi 与 全 校 学 生 的 平均 身高 a 可 能 相去 其 远 . 如 
采 我 们 观察 10 个 学 生 的 身高 而 取 其 平均 , 则 它 有 更 大 的 机 会 与 a 
更 接近 些 . 如 观察 100 个 , 则 其 平均 又 能 更 与 a 接近 些 . 这 些 都 是 
我 们 日 常 经 验 中 所 体验 到 的 事实 .大 数 定理 对 这 一 点 从 理论 的 高 
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度 给 予 概括 和 论证 ， 
3.4.1 大 数 定理 


定理 4.1 设 Xi,X,，…,X,,… 是 独立 同 分 布 的 随机 变量 ， 
记 它 们 的 公共 均值 为 a. 又 设 它们 的 方差 存在 并 记 为 o*. 则 对 任 
意 给 定 的 e>>0 有 
limP(|X, —- al 之 e)=0 (X, 见 (4.1)) (4.2) 
(4.2) 这 个 式 子 指出 了 “ 当 nn 很 大 时 , XX, 接近 a ”的 确切 含 
义 : 它 的 意义 是 概率 上 的 ,不 同 于 微 积 分 意义 下 某 一 列 数 a, 收敛 
于 数 &a. 按 (4.2) 只 是 说 :不 论 你 给 定 怎样 小 的 e>>0, XX, 与 a 的 偏 
离 有 和 否 可 能 达到 e 或 更 大 呢 ? 这 是 可 能 的 ,但 当 ? 很 大 时 ,出 现 这 
种 较 大 偏差 的 可 能 性 很 小 ,以 致 当 ”很 大 时 ,我 们 有 很 大 的 (然而 
不 是 百分之百 的 ) 把 握 断 言 X ,很 接近 a . 拿 上 面 学 生 身 高 的 那个 
例子 说 ,即使 你 抽 了 100 个 以 至 1000 个 学 生 ,你 有 没有 绝对 的 把 
握 说 ,这 100 个 或 1000 个 学 生 的 平均 身高 一 定 很 接近 全 校 学 生 的 
平均 身高 a 呢 ? 没 有 ,因为 理论 上 不 能 排除 这 种 可 能 性 :你 碰巧 
把 全 校 中 那 100 或 1000 个 最 高 的 学 生 都 抽出 来 了 .这 时 你 计算 的 
X, 就 会 与 a。 有 很 大 差距 .但 我 们 也 能 相信 ,如 果 抽 样 真是 随机 的 
(每 一 学 生 有 同等 被 抽出 的 机 会 ), 则 随 着 抽样 次 数 增多 ,这 样 的 可 
能 性 会 愈 来 愈 小 . 这 就 是 (4.2) 式 的 意思 . 像 (4.2) 式 这 样 的 收敛 
性 ,在 概率 论 中 叫做 “ 义 , 依 概 率 收 敛 于 a ”. 
为 了 证 明定 理 4.1, 需 要 下 面 的 概率 不 等 式 : 
马尔 科 夫 不 等 式 ” 若 Y 为 只 取 非 负 值 的 随机 变量 , 则 对 任 给 
常数 >>0 有 
P(Y>e) <E(Y)/e (4.3) 
设 Y 为 连续 型 变量 ,密度 函数 为 f(y). 因 为 Y 只 取 非 负 值 ， 
有 f(y)=0 当 y<0. 故 


E(Y)= | ydy >| ydy 
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因为 在 [e ,cc ) 内 总 有 y 之 e, 且 | f(y)dy 就 是 P(Y>>e). 故 


E(Y)>| yw(y)dy>e] f(y)dy = eP(Y>e) 


即 (4.3). 当 Y 为 离散 型 时 证 明 相 似 , 请 读者 自己 完成 . 
不 等 式 (4.3) 的 一 个 重要 特例 为 
契 比 雪夫 不 等 式 . 若 Var(Y) 存 在 , 则 
Pl(|Y -EY|>e)< Var(Y)/e’ (4.4) 
为 证 此 ,只 须 在 (4.3) 式 中 以 [Y-EYJ]* 代 Y,e” 代 e, 并 注意 
Pl((Y -EY)>e’)=P(|Y-— EY|>e ) 可 . 
现在 转 到 定理 4.1 的 证 明 . 利 用 契 比 雪夫 不 等 式 (4.4), 并 注 


意 天 (X,) = > ECX )/ = na/n 二 a，, 得 
P(|X, -al>e)< Va X,)/e’ (4.5) 


0 ) 而 X1,…,X, 独立 ,有 


Var( X, )= 记 D Var(X) = 1 0 = 0o*/n 


以 此 代入 (4.5), 得 
P(|X, ~-al>e)<o/(ne)—>0, 当 n>% 
这 证 明了 (4.2). 
定理 4.1 的 一 个 重要 特例 , 即 前 面 提 到 的 “频率 收敛 于 概率 ”: 
limP(|p, -P|>e)=0 (4.6) 
这 个 定理 是 最 早 的 一 个 大 数 定理 ,是 伯 努 利 在 1713 年 一 本 著作 中 
证 明 的 ,前 称 为 们 努 利 大 数 定 理 . 
大 数 定理 的 研究 是 概率 论 中 一 个 很 重要 .古老 且 至 今 仍 尚 活 
路 的 课题 ,有 许多 深刻 的 结果 . 例如 ,不 用 假定 X, 的 方差 存在 也 
可 以 证 明 (4.2) 式 :XX1, 义 ，,… 不 必 同 分 布 其 至 也 可 以 不 独立 (当然 
仍 得 有 一 定 限制 ) ,收敛 也 可 以 改 成 其 他 更 强 的 形式 等 .这 些 都 超 
出 本 书 的 范围 之 外 . 
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在 概率 论 中 ,大 数 定 理 常 称 为 “大 数 定律 ”这 个 字面 上 的 不 
同 ,也 不 见得 有 很 特殊 的 含义 .但 是 , “定理 ' 一 词 往往 用 于 指 那 种 
能 用 数学 工具 严格 证 明 的 东西 ,而 “定律 " 则 不 一 定 是 这 样 .如 牛顿 
的 力学 三 大 定律 ,电学 中 的 欧姆 定律 之 类 .这 牵涉 到 一 个 从 哪个 角 
度 去 看 的 问题 . 像 (4.2) 式 这 样 有 确切 数学 表述 ,并 能 在 一 定 的 理 
论 框 架 内 证 明 的 结果 , 称 之 为 “定理 ?无疑 是 恰当 的 .可 是 , 当 我 们 
泛泛 地 谈论 "平均 值 的 稳定 性 ”( 即 稳定 到 理论 上 的 期 望 值 ) 时 ,这 
表述 了 一 种 全 人 类 多 年 的 集体 经 验 , 有 些 哲理 的 味道 . 且 这 种 意识 
也 还 早 于 现代 概率 论 给 之 以 严格 表述 之 前 ,因此 , 称 之 为 “定律 ”也 
不 算 不 恰当 . 

3.4.2 ”中心 极限 定理 

中 心 极限 定理 的 意义 已 在 本 节 开 始 处 阐述 过 了 . 如 我 们 所 曾 
指出 的 ,这 是 指 一 类 定理 .下 面 的 定理 4.2 是 其 中 之 一 : 


定理 4.2 设 闵 ,XX;,…, 义 ,,… 为 独立 同 分 布 的 随机 变量 ， 
E(X,) =a,Var( Xi) =o2;,0<o2<eco. 则 对 任何 实数 工 , 有 


limP A tt Xs na) Sr)= Br) (4.7) 
这 里 B(xz) 是 标准 正 态 分 布 NU0,1) 的 分 布 函数 , 即 
1] 1” 2 
fe 一 一 一 t [2 _ 
(xz) | dz (4.8) 


注意 Xi+…+X 有 均值 ha ,方差 no?. 故 
(Xi1 + + X, ~ na)/ (Vne). 

避 是 Xi +… + X, 的 标准 化 ,即使 其 均值 变 为 0 方差 变 为 1, 以 与 
N(0,1) 的 均值 方差 符合 . 

(4.7) 告 诉 我 们 , 虽 则 在 一 般 情况 下 我 们 很 难 求 出 X + 
义 , 的 分 布 的 确切 形式 ,但 当 ”很 大 时 ,可 以 通过 (xz) 给 出 其 近 
似 值 .例如 , 若 已 知 < =1,0 =4,n = 100. 要 求 P(XI+-……+ X100 
人 125). 因 na=100,Y no =20, 把 事件 XX! 十 … + XIw 志 125 改写 
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为 (XI 十 … 十 久 100 一 100)/A20 过 1.25, 用 (4.7) 得 到 上 述 概 率 的 近 
似 值 为 6(1.25) = 0.8944. 这 里 当然 有 一 定 的 误差 .有 许多 人 研究 
工作 就 是 为 了 估计 这 种 误差 ,也 得 出 了 一 些 深刻 的 结果 .但 是 ,这 
种 误差 估计 要 求 对 X; 的 分 布 或 其 矩 有 一 定 的 了 解 . 

定理 4.2 通称 为 林 德 伯 格 定理 或 林 德 伯 格 - 莱 维 定理 ,是 这 两 
位 学 者 在 本 世纪 20 年 代 证 明 的 “中 心 极限 定理 ”的 命名 也 是 始 于 
这 个 时 期 , 它 是 波 伊 亚 在 1920 年 给 出 的 .但 定理 4.2 并 非 最 早 的 
中 心 极限 定理 .历史 上 最 早 的 中 心 极限 定理 是 定理 4.2 的 一 个 特 
例 , 即 当 X; 由 (1.20) 式 定义 时 ,这 时 ,如 以 前 多 次 指出 的 ,XI +…: 
+ X， 就 是 某 事 件 A 在 2” 次 独立 试验 中 发 生 的 次 数 .这 个 特例 很 
重要 ,值得 单独 列 为 一 条 定理 . 

定理 4.3 设 义 |, 义 ;,…,X,,… 独 立 同 分 布 ,X, 分 布 是 

P(X;= 1)=p,P(X; =0)=1-p,0<p<!1 

则 对 任何 实数 zx ,有 


本 1 利夫 一 如 人 一 
lm Dt 十 入) 万) 委 ) = &(z) 
(4.9) 


定理 4.3 是 定理 4.2 的 特例 ,只 须 注 意 E(X,)=p,Var(X;) 
= 访 (1 一 访 ) 又 此 处 XX!1 十 … 十 XX, 服从 二 项 分 布 B(n,p), 故 定理 
4.3 是 用 正 态 分 布 去 逼近 二 项 分 布 .在 第 二 章 例 1.2 曾 指出 过 用 
波 哇 松 分 布 逼 近 二 项 分 布 .二 者 的 应 用 不 同 :(4.9) 用 于 p 固定 ， 
因而 当 n 很 大 时 np 很 大 . 而 波 哇 松 逼近 则 用 于 p 很 小 (可 设想 成 
PP 随 n 变化 以 趋向 于 0) 但 np = 4 不 太 大 时 .共同 之 点 是 7 必须 
相当 大 . z 

定理 4.3 称 为 标 莫 弗 - 拉 普 拉 斯 定理 ,是 历史 上 最 早 的 中 心 极 
限定 理 . 1716 年 棣 莫 弗 讨论 了 p= 方 的 情形 ,而 拉 普 拉 斯 则 把 它 
推广 到 一 般 p 的 情形 . 

如 果 ii ,ta 是 两 个 正 整 数 ,ti<<t2. 则 当 相当 大 时 , 按 (4.9) 
近似 地 有 
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P(t XI 十 *** 十 XX, 之 1) > BD(y,) 一 Dlyi) (4.10) 
其 中 
y= ti- np)/vV np p), i=1,2 (4.11) 
我 们 指出 : 若 把 y1, vy 修正 为 
y= (np)/V pp) 
1 


y2 = (+ )/v np(l— p) (4.12) 
再 应 用 公式 (4.10), 则 一 般 可 提高 


精度 . 其 道理 可 以 从 图 3.7 看 出 . 
” ”此 图 中 每 一 矩形 小 条 底 边 长 为 1， 
底 边 中 点 为 非 负 整数 ,而 答 形 的 


高 ,就 是 P(X1+… 十 XX, 二 &), 即 
二 项 概率 5(&;n,p). 图 中 的 曲线 
则 是 正 态 分 布 N(np,np(1 一 Zp)) 
的 密度 函数 的 曲线 . 近似 式 (4.10) 的 意思 ,无 非 是 用 这 曲线 下 的 面 
积 来 近似 代替 这 些 和 矩形 条 的 面积 .可 是 细 看 图 形 3.7, 可 知 ,包括 
点 t1st1+1,…,t2, 这 些小 条 在 横 轴 上 所 占 范围 ,是 左 起 t1 一 122， 
右 止 t2 +12, 故 曲线 下 的 面积 ,也 应 在 这 两 个 起 止 点 之 间 去 计 
算 . 这 就 是 修正 公式 (4.12) 的 来 由 . 当 ”很 大 时 ,这 个 修正 并 不 很 
重要 ,但 在 ”不 太 大 时 则 有 比较 大 的 影响 . 

例 4.1 设 某 地 区 内 原 有 一 家 小 型 电影 院 , 因 不 甫 需要 , 拟 筹 
建 一 所 较 大 型 的 . 设 据 分 析 , 该 地 区 每 日 平均 看 电影 者 约 有 ?= 
1600 人 , 且 预 计 新 电影 院 建成 开业 后 ,平均 约 有 3/4 的 观众 将 去 

现 该 影院 在 计划 其 座位 数 时 ,要 求 座 位 数 尽 可 能 多 ,但 “ 空 座 
达到 200 或 更 多 ”的 概率 又 不 能 超过 0.1. 问 设 多 少 座位 为 好 ? 

设 把 每 日 看 电影 的 人 排 号 为 1,2…,1600, 且 令 

1 ,和 大 第 i 个 观众 去 新 影院 
从 ; 二 0, 若 不然 i 二 1,"…,1600 
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则 按 假 定 有 P(X,=1)=3/4,P(X;,=0) 二 1/4. 又 假定 各 观众 去 不 
去 电影 院 系 独立 选择 , 则 Xi ,XX;,… 是 独立 随机 变量 . 
现 设 座位 数 为 m , 则 按 要 求 
P(XI + + Xio%w Sm — 200) 0.1 
在 这 个 条 件 下 取 m 最 大 .这 显然 就 是 在 上 式 取 等 号 时 ,因为 np = 
1600.:(3/4)=1200,V np(l1 一 pp)=10V3, 按 (4.12) 的 修正 ,m 应 
满足 条 件 


® | (m -200+ 方 - 1200)/ (10v5))= 0.1 


查 B(x ) 的 表 得 知 , 当 B(x)=0.1 时 ,zx 二 一 1.2816” .由 
(m ~ 200 + 1/2 - 1200)/ (10Y3)=- 1.2816 

定 出 mm 三 1377.31 守 1377. 在 本 例 中 ,(4.12) 式 的 修正 没有 什么 影 
啊 . 

直到 本 世纪 30 年 代 , 中 心 极限 定理 的 研究 曾 是 概率 论 的 一 个 
重要 内 容 , 至 今 仍 是 一 个 活跃 的 方向 .推广 的 方向 如 独立 不 同 分 布 
以 至 非 独 立 的 情形 ,由 中 心 极限 定理 而 引起 的 误差 的 估计 ,以 及 与 
之 相关 联 的 问题 如 大 偏差 问题 之 类 . 


习 十 


. 计算 对 数 正 态 分 布 的 均值 和 方差 (对 数 正 态 分 布 见 第 二 章 习 题 19). 
. 计算 均匀 分 布 RC(a ,6) 的 峰 度 系数 . 
. 计算 超 几何 分 布 的 均值 和 方差 . 

4. 一 人 有 NN 把 钥匙 ,每 次 开门 时 ,他 随机 地 拿 出 一 把 (只 有 一 把 钥匙 能 
打 升 这 道门 ) ,直到 门 打开 为 止 .以 X 记 到 此 时 为 止 用 的 钥匙 数 (包括 最 后 拿 
对 的 那 一 把 ). 按 以 下 两 种 情况 分 别 计算 已 (X):(a) 试 过 不 行 的 不 再 放 回 去 . 
(b) 试 过 不 行 的 仍 放 回 去 . : 


(TD 一 


* 一 般 B(xz) 的 表 上 只 列 出 当 B(x) 之 1 人 2 时 ,zz 之 值 .车 B(xz)< 之 12, 则 须 先 由 公 
式 B(x )=1 一 B(xz)(>1/2) 查 出 ~xz 再 得 出 x. 有 的 表 列 出 的 是 由 2(1 B(x)) 之 
值 求 z(z>0). 这 时 对 本 例 而 言 . 应 先 由 2(1- 更 (y))=0.2, 定 出 y, 再 取 xz= -》 即 
得 . 
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5. 某 县 有 N 农户 ,其 年 收入 分 别 为 a1,…,av. 为 估计 平均 收入 a = (ai 
+… 十 aNn)AN ,随机 不 放 回 地 抽出 n 农户 (1 等 n 和 入) ,以 六 1 ,… ,XX 记 所 抽 
出 的 农户 的 年 收入 ,而 以 六 = (Xi 十 … 十 XX,)/n 去 估计 a4. 计算 已 (X) 和 
Var( X ). 

6. 一 盒 中 有 x 个 不 同 的 球 , 其 上 分 别 写 数字 1,2,…,n .每 次 随机 抽出 1 
个 ,登记 其 号 码 , 放 回去 ,再 抽 , 一 直 抽 到 登记 有 r 个 不 同 的 数字 为 止 .以 X 
记 到 这 时 为 止 的 抽 球 次 数 ,计算 EF(X). 

7. 把 7 个 球 随机 地 放 入 个 盒子 中 ,以 XX 记 空 盒 个 数 , 计 算 E(X). 此 
题 如 直接 从 计算 P(X=) 出 发 很 难 , 但 用 下 述 步骤 可 以 解决 . 

(a) 以 pi《r,n) 记 个 球 随机 放 和 人 nn 盒 恰 有 上 个 空 盒 的 概率 ,用 全 概率 
公式 证 明 : 


nC— 


+ 1 
n k 十 piu(r,n) < 


(1) 


(b) 以 mr 记 题 中 要 计算 的 均值 EE(X). 由 (a) 中 得 出 的 公式 (1) 两 边 乘 & 
对 率 求 和 ,证 明 


pilrt+1,n)= p(r,n) 


1 
n 


ml = (1- )m,, r = 0,1,2,.… 


再 由 mo=n 即 得 m, = (1- 士 ) 

8. 设 为 目 然 数 ,f(x)= CA1+ zz)", 找 常数 C, 使 f(z) 为 概率 密度 
函数 ,并 计算 其 均值 方差 . 

9. 设 X1,X2 独立 ,都 服从 标准 正 态 分 布 N(0,1). 记 Yi = max(Xi， 
X2),Y2=Imin(Xi,X2). 计 算 E(Y1),E(Y,). 

10. 设 Xi,X2 独立 ,都 服从 卡 方 分 布 ,而 常数 5 非 0 非 1, 则 XX,+ bX, 
决 不 服从 卡 方 分 布 . 

11. 设 X,Y 独立 ,都 服从 标准 正 态 分 布 ,而 Z= (aX? + bY?)/A(X2+ 
六 ) ,其 中 ap 为 常数 .计算 E(Z) 和 Var(2). 

12. 设 随机 变量 X 只 取 非 负 值 , 其 分 布 函数 为 F(z), 证 明 ; 在 以 下 两 种 
情况 都 有 


E(X)= | 5 一 下 (z) jdz (2) 


(a) X 有 概率 密度 函数 F(z)， 

(b) X 为 离散 型 ,有 分 布 PCX=k)= pi ,k=0,1,2,… 

注 :公式 (2) 对 任何 非 负 随机 变量 都 对 ,并 不 限于 (a) ,(b) 两 种 情况 但 证 
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明 超 出 初等 方法 之 外 . 

13. 设 Xi ,X。， 独立 同 分 布 ,都 只 取 正 值 , 则 必 有 EE(XI/X;) 宇 1, 等 号 当 
且 仅 当 Xi,X， 只 取 一 个 值 时 成 立 . 

注 : 按 此 题 结论 ,也 有 E(X;AX|) 之 1(X1, 尺 ; 地 位 平等 ), 故 E(X1/X,) 
RE(N2 AI 三 1 但 (XI7AX (KX,/X1)=1. 

14. 设 Xi1,…,X; 独立 同 分 布 ,都 只 取 正 值 .证 明 : 

E(w) 

15. 设 pi1,…,pa 都 界 于 0,1 之 间 , 记 pp 为 它们 的 算术 平均 . 作 两 串 独立 
试验 ,每 串 各 区 次 ,在 第 一 串 中 ,事件 A 在 各 次 试验 中 发 生 的 概率 ,依次 为 
Pl,"… ,pa: 在 第 二 串 中 ,事件 A 在 各 次 试验 中 发 生 的 概率 始终 保持 为 户 . 以 
Yi 和 Y2 分 别 记 在 第 一 串 和 第 二 串 试验 中 事件 A 发 生 的 总 次 数 .证 明 Y， 
Y- 有 相同 均值 ,而 Var( YY) 守 Var( Y2) ,等 号 当 且 仅 当 户 | =…= 户 , = 户 时 成 
立 . 试 给 这 后 一 结论 以 一 直观 的 解释 . 

16. 设 随机 变量 X 只 取 [0,1] 上 的 值 .证 明 Var(x) 志 1/4. 指 出 等 号 达到 
的 情况 ,把 这 结果 推广 到 X 只 取 [a,65] 上 的 值 的 情况 . 

17. 在 第 一 章 例 1.2 中 , 若 先 到 的 人 必 等 到 后 到 的 人 来 了 为 止 , 问 先 到 
的 人 平均 要 等 多 久 ? 

18. 设 X 服从 指数 分 布 , 试 计 算 其 中 位 数 x 以 及 EX-nm|. 

19. 设 夺 有 概率 密度 六 数 A(z). 令 hac)= 开 1X-cl :证明 : 当 。 等 于 
X 的 中 位 数 x 时 ,h(a) 达 到 最 小 (这 是 中 位 数 一 个 重要 性 质 ). 

20. 解 第 二 章 27 题 ,用 如 下 的 方法 ; 找 5, 使 X+6bY 和 XbY 的 相关 系 
数 为 0. 这 比 用 第 二 章 的 方法 简单 得 多 . 

21. 设 Xi1,X, 独立 ,分 别 有 概 率 密度 函数 f(xz1) 和 g(xz;). 试 求 Y= 
XIX2 的 密度 函数 ,并 用 所 得 结果 证 明 

E(Y) = E(X1)E(X,) 
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第 四 章 参数 估计 
4.1 数理 统计 学 的 基本 概念 


从 本 章 起 ,我 们 转 人 课程 的 第 二 部 分 一 一 数理 统计 学 .数理 统 
计 学 与 概率 论 是 两 个 有 密切 联系 的 姊妹 学 科 . 大 体 上 可 以 说 :概率 
论 是 数理 统计 学 的 基础 ,而 数理 统计 学 是 概率 论 的 重要 应 用 . 

数理 统计 学 是 一 门 应 用 性 很 强 的 学 科 , 有 其 方法 .应 用 和 理论 
基础 .在 西方 “数理 统计 学 "一 词 是 专 指 统计 方法 的 数学 基础 理论 
那 部 分 而 言 . 在 我 国 则 有 较 广 的 含义 , 即 包括 方法 .应 用 及 理论 基 
础 都 在 内 ,而 这 在 西方 是 称 为 “统计 学 ”. 在 我 国 ,因为 还 有 一 门 被 
认为 是 社会 科学 的 统计 学 存在 ,这 两 个 名 词 的 区 别 使 用 ,有 时 是 必 
要 的 . 


4.1.1 什么 是 数理 统计 学 


当 我 们 用 试验 或 观察 的 方法 研究 一 个 问题 时 ,首先 要 通过 适 
当 的 观察 或 试验 以 取得 必要 的 数据 ,然后 就 是 对 所 得 数据 进行 分 
析 ,以 对 所 提问 题 作出 尽 可 能 正确 的 结论 .为 什么 说 “ 尽 可 能 正确 ” 
呢 ? 因为 数据 一 般 总 是 带 有 随机 性 的 误差 .需要 指出 的 是 ,这 里 指 
的 误差, 不单 是 通常 意义 下 的 因 测 量 不 准 而 招致 的 误差 ,例如 测量 
一 个 人 的 高 度 , 因 仪 句 和 操作 的 原因 必然 有 一 定 的 误差 一 一 自然 ， 
这 种 误差 也 是 构成 数据 的 误差 的 一 个 可 能 的 来 源 .这 里 所 说 的 数 
据 误 差 , 主 要 指 的 是 由 于 观察 和 试验 所 及 ,一般 只 能 是 所 研究 的 事 
物 的 一 部 分 ,而 究竟 是 娜 一 部 分 则 是 随机 的 . 例如 一 个 学 校 有 上 万 
名 等 生 , 你 从 中 抽出 50 人 来 研究 该 校 学 生 的 学 习 情 况 ,抽取 的 结 
末 ( 那 30 个人) 不同, 所 得 数据 就 不 同 ,这 完全 赁 机 会 定 .我 们 说 的 
随机 误差 主要 是 指 这 个 .由 于 数据 带 有 这 样 的 随机 性 ,通过 分 析 这 
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些 数据 而 作出 的 结论 ,也 就 难保 其 不 出 错 了 .分 析 方 法 的 要 旨 , 就 
在 于 使 可 能 产生 的 错误 愈 小 愈 好 ,发 生 错误 的 机 会 愈 小 愈 好 ,这 就 
需要 使 用 概率 论 的 工具 ,在 此 我 们 就 可 以 初步 看 出 概率 论 和 数理 
统计 学 的 密切 关系 . 

数理 统计 学 就 是 这 样 一 门 学 科 : 它 使 用 概率 论 和 数学 的 方法 ， 
研究 怎样 收集 (通过 试验 或 观察 ) 带 有 随机 误差 的 数据 ,并 在 设 定 
的 模型 ( 称 为 统计 模型 ) 之 下 ,对 这 种 数据 进行 分 析 ( 称 为 统计 分 
析 ), 以 对 所 研究 的 问题 作出 推 斯 ( 称 为 统计 推断 ). 让 我 们 举 一 个 
例子 来 说 明 这 些 概念 . 

例 1.1 菏 工 三 生产 大 批 的 电子 元 件 . 按 第 二 章 例 1.7 的 理 
论 , 我 们 认为 有 理由 假定 元 件 的 寿命 服从 指数 分 布 , 见 第 二 章 
(1.20) 式 .在 实际 应 用 中 ,我 们 可 以 提出 许多 感 兴趣 的 问题 .例如 ; 

1. 元 件 的 平均 寿命 如 何 ? 

2. 如 果 你 是 使 用 单位 .要 求 平均 寿命 能 达到 某 个 指定 的 数 /， 
例如 5000 小 时 . 问 这 批 元 件 可 否 被 接受 ? 

在 此 ， 元 件 寿 命 服从 指数 分 布 "提供 了 一 个 数学 模型 , 即 本 问 
题 的 统计 模型 (参见 例 1.3 中 的 补充 说 明 ). 如 果 你 知道 了 该 分 布 
中 的 参数 之 值 , 则 据 第 三 章 例 1.4, 我 们 知道 平均 寿命 1 ,于 
古 上 面 两 个 问题 马上 就 可 以 得 到 回答 .但 在 实用 上 4 往往 是 未 
知 , 于 是 我 们 就 只 好 从 这 一 大 批 元 件 中 随机 抽出 若干 个 ,例如 7 
个 ,并 测 出 其 寿命 分 别 为 Xi ,…,X, ,这 nn 个 元 件 如 何 选 取 ” 主 要 
是 要 保证 这 大 批 元 件 中 ,每 一 件 有 同等 的 被 抽出 的 机 会 ,而 这 并 不 
是 很 容易 办 到 的 事情 ,需要 想 些 办 法 , 既 能 减轻 工作 量 ,又 能 尽 可 
能 保证 上 述 同等 机 会 的 要 求 . 

有 了 数据 Xi，…,X， 后 ,一 个 自然 的 想法 是 :用 其 算术 平均 值 
X ==(X1+…+X,)/n 去 估计 未 知 的 平均 寿命 1/4. 当然 , 叉 不 -- 
定 恰 好 等 于 工人 .但 实际 问题 中 ,我 们 不 会 也 不 可 能 要 求 所 作 的 估 
计 一 丝 不 差 . 但 误差 可 能 有 多 大 ? 产生 指定 大 小 的 误差 的 机 会 ( 概 
率 ) 有 和 多大? 为 了 使 这 概率 降 至 指定 的 限度 (例如 ,0.1) ,抽出 的 元 
件 个 数 至 少 应 达到 多 少 ? 这 些 问 题 的 解决 方法 及 有 关 理 论 ,就 
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是 数理 统计 学 的 内 容 . 

本 例 提出 的 第 一 个 问题 称 为 参数 估计 回 题 ,因为 * 是 元 件 寿 
命 分 布 中 的 一 个 未 知 参数 ,而 我 们 的 问题 是 要 售 计 由 4 决定 的 一 
个 量 , 即 1 和. 也 可 以 把 问题 提 为 要 求 估 计 参 数 4 本 身 , 这 时 我 们 
可 考虑 使 用 1/X (参见 例 2.2). 参 数 估计 是 最 重要 的 统计 问题 之 

现在 来 谈 第 二 个 问题 . 可 能 认为 :至 少 就 本 例 而 言 ,解决 了 第 
一 个 问题 也 就 解决 了 第 二 个 问题 ,因为 ,既然 用 X 去 估计 平均 寿 
命 , 那 就 看 XX 是 否 不 小 于 指定 的 数 1. 若 关 之 1, 则 接受 该 批 产品 ， 
人 不然 号 不 接受 . 

应 当 承 认 , 这 也 是 一 个 可 以 考虑 的 解法 .但 还 应 注意 到 ,如 上 
文 所 指出 的 : 因 X 估计 平均 寿命 有 误差 ,我 们 得 根据 实际 需要 进 
行 一 定 的 调整 . 即 把 接受 的 准则 定 为 X 宇 /1,i1 是 某 个 选 定 的 数 ， 
可 以 大 于 、 等 于 或 小 于 7. li 定 得 大 些 , 表 示 我 们 的 检验 更 严格 ,这 
在 对 元 件 质量 要 求 很 高 且 供 货 渠 道 较 多 时 可 能 是 适当 的 .反之 ,4 
定 得 小 些 , 表 示 检 验 更 宽 , 这 在 对 元 件 质量 要 求 不 很 高 ,或 急需 这 
些 元 件 而 供 货 渠道 很 少时 ,也 可 能 采取 .从 统计 上 说 ,无 论 你 怎么 
定 有 ,理论 上 你 都 可 能 犯 两 种 错误 之 一 ;一 是 元 件 平均 寿命 达到 
需求 而 被 你 拒 收 了 ,一 是 元 件 平均 寿命 达 不 到 需求 而 被 你 接受 了 . 
这 两 种 错误 各 有 一 定 的 概率 ,它们 在 很 大 程度 上 决定 了 接受 准则 
XX 宇 i1 中 的 4 的 选择 . 

第 二 个 问题 与 第 一 个 问题 不 同 : 它 不 是 要 求 对 分 布 中 的 未 知 
参数 作出 估计 ,而 是 要 在 两 个 决定 (就 本 问题 而 言 就 是 接受 或 拒 收 
该 批 产品 ) 中 选择 一 个 .这 类 问题 称 为 假设 检验 问题 ,也 是 最 重要 
的 统计 间 题 之 一 . 


4.1.2 总 体 
总 体 是 指 与 所 研究 的 问题 有 关 的 对 象 ( 个 体 ) 的 全 体 所 构成 的 
集合 .如 在 例 1.1 中 , 那 一 大 批 元 件 就 是 问题 的 总 体 ,而 每 一 单个 


元 件 就 是 一 个 个 体 , 所 有 这 些 个 体 就 构成 问题 的 总 体 . 又 如 
152 ， 


例 1.2 要 研究 某 大 学 学 生 的 学 习 情 况 , 则 该 校 的 全 体 学 生 
构成 问题 的 总 体 . 每 一 个 学 生 则 是 该 总 体 中 的 一 个 个 体 . 

总 体 随 所 研究 的 范围 而 定 .如 在 上 例 中 ,者 你 研究 全 国 大 学 生 
的 学 习 成 绩 , 则 总 体 就 大 多 了 : 它 包含 全 国 所 有 在 学 的 大 学 生 . 总 
体 如 何 定 ,取决 于 研究 目的 ,也 受 人 力 物 力 时 间 等 因素 的 限制 . 

对 于 大 多 数 实际 问题 ,总 体 中 的 个 体 是 一 些 实在 的 人 或 物 , 而 
问题 中 所 注意 的 ,并 不 在 于 这 些 人 或 物 本 身 ,而 在 于 所 关心 的 某 种 
站 标 . 例如 一 个 学 生 有 身高 体重 姓氏 笔划 籍贯 出 身 ……- 等 特征 , 当 
我 们 研究 学 生 学 习 成 绩 时 ,对 这 些 都 不 关心 ,而 只 注意 其 考分 如 
何 . 在 例 1.1 中 ,我 们 只 注意 元 件 的 寿命 如 何 . 这样, 也 可 以 把 我 们 
感 兴 趣 的 那个 指标 值 就 作为 该 个 体 (例如 ,大 学 生 A 得 90 分 , 即 
以 90 这 个 数 代 蔡 A ) ,而 总 体 就 由 一 些 数 所 组 成 . 

单 是 这 样 还 不 行 .这 里 有 两 个 问题 :一 是 总 体 中 这 样 一 大 堆 杂 
乱 无 章 的 数 没 有 赋 子 什么 数学 或 概率 的 性 质 ,因而 无 法 使 用 有 力 
的 概率 论 工 具 去 研究 它 ; 二 是 各 种 总 体 变 得 没有 区 别 .例如 ,大 学 
生 的 学 习 成 绩 也 是 一 堆 数 ,一 大 批 元 件 的 寿命 也 是 一 堆 数 ,大 家 都 
一 样 了 .解决 这 些 问 题 的 途径 ,就 涉及 总 体 这 个 概念 的 核心 总 
体 的 概率 分 布 . 例如 ,在 例 1.1 中 元 件 寿命 分 布 为 指数 分 布 , 例 
1I.2 学 生 的 学 习 成 绩 可 以 假定 为 服从 正 态 分 布 .总 体 分 布 不 同 ,分 
析 的 方法 也 就 不 同 , 赋 有 一 定 概 率 分 布 的 总 体 就 称 为 统计 总 体 . 

因此 ,经 过 以 上 几 步 的 分 析 ,我 们 就 得 出 在 数理 统计 学 中 “总 
体 " 这 个 基本 概念 的 要 旨 一 一 总 体 就 是 一 个 概率 分 布 . 当 总 体 分 布 . 
为 指数 分 布 时 , 称 为 指数 分 布 总 体 ; 当 总 体 分 布 为 正 态 分 布 时 , 称 
为 正 态 分 布 总 体 或 简称 正 态 总 体 ,等 等 . 两 个 总 体 , 即 使 其 所 含 个 
体 的 性 质 根本 不 同 ,只 要 有 同一 的 概率 分 布 , 则 在 数理 统计 学 上 就 
视 为 是 同类 总 体 .例如 人 的 寿命 也 可 以 服从 指数 分 布 , 它 与 元 件 寿 
命 的 分 布 一 样 ,处 理 二 者 的 统计 问题 的 方法 也 一 样 , 即 可 视 为 同一 
类 总 体 . 

对 以 上 所 说 的 要 作 一 点 说 明 : 如 例 1.1 所 显示 的 ,虽然 我 们 假 
定 了 元 件 寿 命 服从 指数 分 布 , 但 并 没有 指定 其 中 参数 1 之 值 . 既 
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然 A 未知, 原则 上 4 可取 0 到 oo 内 任何 值 , 故 更 正确 地 应 当 说 :总 
体 分 布 是 一 个 概率 分 布 族 ( 在 此 为 指数 分 布 族 ) 的 一 员 . 这 分 布 族 
包含 一 个 参数 1 , 称 为 单 参数 分 布 族 . 例 1.2 的 总 体 分 布 一 一 正 态 
分 布 N(4,o”), 包 含 两 个 参数 jy 和 o*(y 可 取 任 何 实 数值 而 o? 只 
能 取 大 于 0 的 值 ), 是 一 个 两 参数 分 布 族 .另外 ,在 有 些 情况 下 ,我 
们 只 是 假定 总 体 有 一 定 的 概率 分 布 而 并 不 明确 知道 其 数学 形式 . 
如 在 例 1.1 中 ,也 可 以 只 承认 寿命 有 一 定 的 概率 分 布 函 数 下 (xz )， 
F(0) =0( 因 寿命 总 大 于 0) ,其 他 别 无 所 知 .这 时 ,总体 分 布 不 能 通 
过 硅 干 个 未 知 参数 表达 出 来 ,这 种 情况 称 为 非 参 数 总 体 .对 非 参 数 
总 体 , 昌 不 知 其 数学 形式 ,但 统计 问题 照样 可 以 提出 来 . 例如 估计 
平均 寿命 的 问题 ,不 假定 元 件 寿 命 分 布 为 指数 分 布 也 有 意义 , 且 使 
用 X 去 估计 平均 寿命 看 来 仍 是 一 个 合理 的 方法 .自然 ,由 于 分 布 的 
形式 未 知 ,进一步 的 讨论 困难 就 更 大 ,这些 在 以 后 会 逐步 指明 . 

上 面 所 讲 的 总 体 概念 ,在 很 大 程度 上 要 归功 于 数理 统计 学 最 
主要 的 莫 基 者 ,伟大 的 英国 统计 学 家 R. A. 费 软 尔 . 他 引进 了 “无 
眼 总 体 " 这 个 概念 一 一 现实 问题 中 , 当 所 考察 的 个 体 是 由 一 些 看 得 
见 \ 措 得 着 的 对 象 所 构成 时 (如 例 1.1,1.2), 总 体 总 是 有 限 的 .有 
限 总 体 相应 的 分 布 只 能 是 离散 的 ,其 具体 形式 将 与 个 体 总 数 有 关 
且 缺 乏 一 个 简洁 的 数学 形式 ,这 会 使 有 力 的 概率 方法 无 法 使 用 . 引 
进 无 限 总 体 的 概念 ,在 概率 论 上 相当 于 用 一 个 连续 分 布 去 逼近 高 
散 分 布 . 当 总 体 所 含 个 体 极 多 时 ,这 种 逼近 所 带 来 的 误差 ,从 应 用 
的 观点 看 已 可 以 忽略 不 计 . 更 好 的 是 ,事实 证 明 : 几 种 常见 且 在 概 
率 论 上 较 易 处 理 的 分 布 ,如 指数 分 布 和 正 态 分 布 等 ,尤其 是 正 态 分 
布 ,对 许多 实用 问题 的 总 体 分 布 给 出 了 足够 好 的 近似 ,而 围绕 着 这 
些 分 布 建立 了 深入 而 有 效 的 统计 方法 . 

最 后 ,关于 总 体 这 个 概念 还 需要 说 明 一 个 问题 . 从 一 个 例子 入 
手 , 设 有 一 个 物体 ,其 真实 的 重量 a 未 知 ,要 通过 多 次 量 测 的 结果 
去 估计 它 .请 问 在 这 个 问题 中 总 体 是 什么 ? 若 不 假 思索 ,可 能 回答 
说 :因为 与 所 研究 的 问题 有 关 的 对 象 , 就 只 这 个 物体 , 故 这 个 物体 ， 
或 者 其 重量 a ,就 构成 总 体 ,这 个 回答 不 对 .其 所 以 不 对 ,一 则 因为 
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a 未 知 .即使 a 已 知 (这 时 自然 不 存在 估计 它 的 问题 ,但 量 测 其 重 
量 仍 有 意义 ,例如 ,可 能 是 为 了 考察 天 平 的 准确 程度 如 何 ) ,这 个 回 
答 仍 不 对 .因为 你 既然 通过 量 测 ,那么 ,你 所 研究 的 问题 ,实质 上 是 
“通过 量 测 结果 去 估计 a 之 值 其 精度 如 何 ”. 这 样 ,每 一 个 可 能 的 
量 测 结果 都 是 一 个 个 体 ,而 总 体 是 由 “一 切 可 能 的 量 测 结果 "组 成 . 
这 只 是 一 个 想像 中 存在 的 集合 ,因为 不 可 能 去 进行 无 限 次 量 测 ,把 
所 有 可 能 的 量 测 结果 一 一 列 出 来 .这 与 我 们 前 面 几 个 例子 中 那 种 
看 得 见 摸 得 着 的 总 体 不 同 :这 里 的 总 体 只 是 在 想像 中 存在 , 它 的 个 
休 是 通过 试验 “制造 "出 来 的 一 一 每 年 一 次 ,就 制造 出 一 个 量 测 值 ， 
这 种 情况 在 实际 应 用 中 非常 之 多 .给 这 种 总 体 规定 分 布 也 一 样 . 拿 
本 例 来 说 ,只 须 说 一 句 “ 量 测 结 果 服 从 某 某 分 布 (如 正 态 分 布 )” 就 
行 .如果 不 绕 这 么 一 个 圈子 ,而 直接 说 : 量 测 结果 是 随机 的 , 它 服从 
某 某 分 布 , 可 能 读者 会 感到 更 易 接受 . 上述 分 析 是 为 了 突出 统计 总 
体 这 个 概念 的 这 种 抽象 形式 ,以 体现 这 个 概念 的 普遍 性 . 
在 某 些 统计 学 著作 中 ,也 常 把 总 体 称 为 “母体 ” 


4.1.3 样本 


样本 是 按 一 定 的 规定 从 总 体 中 抽出 的 一 部 分 个 体 .所 谓 “ 按 一 
定 的 规定 ,就 是 指 总 体 中 的 每 一 个 个 体 有 同等 的 被 抽出 的 机 会 ， 
以 及 在 这 个 基础 上 设立 的 某 种 附加 条 件 . 

由 于 我 们 的 兴趣 不 在 于 个 体 本 身 而 在 于 其 某 一 特征 指标 值 ， 
所 得 样本 表现 为 若干 个 数据 X1,…,X,.n 称 为 “样本 大 小 ”或 “ 样 
本 容量 ', “样本 量 ”. 样 本 Xi,…,X, 中 的 每 一 个 X 也 称 为 样本 . 
有 时 ,为 区 别 这 种 情况 ,把 Xi,…,X, 的 全 体 称 为 一 “组 ”样本 ,而 
X; 称 为 其 中 的 第 i 个 样本 . 

在 一 个 具体 问题 中 ,样本 X1,…,X, 是 一 些 具体 的 数据 .而 在 
理论 的 研究 上 , 则 要 把 它 看 成 为 一 些 随机 变量 .因为 抽 到 哪 一 些 个 
体 是 随机 的 ,因而 其 指标 值 , 即 Xi ,…,X, ,也 是 随机 的 . 

设想 样本 是 一 个 一 个 地 抽出 来 .第 一 次 抽 时 ,是 从 整个 总 体 中 
抽 一 个 .因而 Xi 的 分 布 也 就 与 总 体 分 布 相同 .如果 这 一 个 不 放 回 
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去 ,到 第 二 次 抽 时 ,总 体 中 已 少 了 一 个 个 体 , 其 分 布 有 了 变化 ,因此 
X; 的 分 布 会 与 Xi 的 分 布 略 有 差别 .但 是 ,如 采 总 体 中 所 包含 的 
个 体 极 多 ,或 如 理论 上 设想 的 ,总 体 中 包含 无 限 多 个 体 , 则 抽 掉 一 
个 或 几 个 ,对 总 体 的 分 布 影响 极 少 或 毫 无 影响 .这 时 ,Xi，…X， 
独立 且 有 相同 的 分 布 , 其 公共 分 布 即 总 体 分 布 .这 是 在 应 用 上 最 常 
见 的 情形 ,也 是 理论 上 研究 得 最 深入 的 情形 ,本 节 主 要 考虑 这 种 情 
况 . 在 数理 统计 学 上 , 称 这 种 情况 为 :Xi,…,X, 是 从 某 总 体 中 抽 
出 的 独立 随机 样本 ,或 简称 为 从 某 总 体 中 抽出 的 样本 . 
当 总 体 中 所 含 个 体 数 不 太 大 时 ,情况 就 不 同 . 考察 以 下 的 例 
子 : 
例 1.3 设 一 批 产 品 包含 N 个 ,内 有 废品 M 个 ,M 未知. 因 
而 废品 率 也 未 知 . 现 从 其 中 抽出 n 个 逐一 检查 它们 是 否 为 废品 ， 
据 此 去 估计 p. 

如 果 把 合格 品 记 为 0 而 废品 记 为 1, 则 总 体 分 布 为 离散 分 布 
P(X=1)=p,P(X=0)=1-p. 设 想 样本 是 一 个 一 个 抽出 的 , 绪 
果 记 为 Xi ,XX, . 如 果 抽 样 是 有 放 回 的 , 即 每 抽出 一 个 作 检 查 以 
后 再 放 回 去 ,下 次 仍 有 同等 机 会 被 抽 , 则 Xi1,…,X; 为 独立 同 分 
布 ,每 一 个 的 分 布 就 是 上 述 总 体 分 布 . 若 用 X = (XI+…+X，)AL7 
( 即 样本 中 的 废品 率 ) 去 估计 p, 则 因 Xi + …+ X, 服从 二 项 分 布 
B(n,p)( 见 第 二 章 例 1.1). 这 个 估计 的 统计 性 质 就 由 此 决定 了 . 

另 一 种 抽样 方式 , 即 常见 的 作法 ,是 一 次 抽出 xn 个 或 一 个 一 
个 抽 但 已 抽出 的 不 再 放 回 .这 时 ,用 义 估 计 上 p 仍 是 一 个 合理 的 选 
择 , 但 因 Xi +…+X, 已 不 是 二 项 分 布 而 是 超 几何 分 布 ( 见 第 二 章 
例 1.4). 这 个 估计 的 统计 性 质 就 与 上 面 所 讲 的 有 所 不 同 . 当 六 不 
很 大 时 ,这 个 差别 不 可 忽视 . 

由 此 例 可 见 ,在 有 限 总 体 的 情况 , 单 由 总 体 分 布 已 不 足以 完全 
决定 样本 的 分 布 如 何 , 要 看 抽样 的 方式 .这 样 ,抽样 的 方式 也 要 作 
为 一 个 要 素 加 入 到 统计 模型 的 内 容 中 来 .在 无 限 总 体 的 情况 ,或 者 
是 有 限 总 体 而 抽样 有 放 回 的 情况 , 按 第 二 章 定 义 3.1, 总 体 分 布 完 
全 决定 了 样本 的 分 布 , 故 就 可 以 把 总 体 分 布 等 同 于 统计 模型 . 
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4.1.4 统计 量 


完全 由 样本 所 决定 的 量 ,叫做 统计 量 . 这 里 要 注意 的 是 “完全 ” 
这 两 个 字 . 它 表明 :统计 量 只 依赖 于 样本 ,而 不 能 依赖 于 任何 其 他 
未 知 的 量 . 特 别 是 , 它 不 能 依赖 于 总 体 分 布 中 所 包含 的 未 知 参 数 . 

例如 , 设 XX ,…,X, 是 从 正 态 总 体 N(x,o?) 中 抽出 的 样本 ， 
则 X= (Xi+… +X,)/n 是 统计 量 ,因为 它 完 全 由 样本 义 | ,…,X， 
决定 .X 一 不 是 统计 量 , 因 为 w 未 知 , 久 -并 不 完全 由 样本 所 
决定 . 

统计 量 可 以 看 作 是 对 样本 的 一 种 “加 工 ”, 它 把 样本 中 所 含 的 
( 茶 一 方面 的 ) 信 息 集中 起 来 .例如 ,上 述 XX 可 用 于 估计 未 知 的 jy. 
可 以 这 样 看 :原始 数据 X1,…,X, 中 的 每 一 个 ,都 包含 有 u 的 车 
二 信息 ,但 这 些 是 杂乱 无 章 的 ,一 经 集中 到 X ,就 有 了 更 明确 的 概 
念 .所 以 ,有 用 的 统计 量 都 是 有的放矢 ”的 ,针对 某 种 需要 而 构造 
的 .如 在 上 例 中 , 若 想 了 解 有 关 总 体 方差 oz 的 情况 , 则 统计 量 交 没 
有 什么 用 .从 方差 是 反映 散布 度 这 方面 去 看 ,下 面 的 统计 量 


S = D(X -XAn 1) (1.1) 


是 有 用 的 .因为 S* 是 样本 XX ,…,X, 的 散布 程度 的 一 个 合理 的 刻 
画 , 它 应 当 与 cx 有 密切 的 关系 , S? 这 个 重要 的 统计 量 叫做 “样本 
方差 ”. 

有 一 类 重要 的 统计 量 叫做 样本 抢 ,分 为 样本 原点 矩 和 样本 中 
心 息 . 设 XX1,…,XX, 为 样本 ,k 为 正 整数 . 则 

ak = (XI 十 十 Xe)/n (1.2) 

称 为 & 阶 样本 原点 矩 . ai = 义 是 最 重要 的 样本 原点 和 矩 , 它 常 称 为 
“样本 均值 .而 


mi 二 2 (XxX; 一 和 六 MA (1.3) 
称 为 & 阶 样本 中 心 矩 ， 


在 第 三 章 定 义 2.2 中 ,我 们 定义 过 随机 变量 X 的 阶 原点 条 
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as 和 阶 中 心 矩 必 .此 处 定义 的 az 是 它们 的 样本 对 应 物 . 有 
时 也 把 os 和 外 称 为 理论 和 矩 , 而 ae ,zx 称 为 经 验算 .这 和 名词 可 以 
用 如 下 的 方式 去 解释 : 设 总 体 分 布 下 有 (理论 ) 矩 ai ,py4. 由 于 不 知 
道 顾 ,也 就 不 知道 we ,yx. 现在 有 从 该 总 体 中 抽出 的 样本 Xl,…， 
X, ,我 们 就 构造 一 个 分 布 下, 去 模拟 下 . 由 于 手头 这 nn 个 样本 X1， 
…, 义 , 的 地 位 是 平等 的 ,一 个 合理 的 选择 是 把 F, 取 成 一 个 离散 
分 布 , 它 在 每 个 值 X; 处 各 有 概率 1/n,i=1,…,nn. 形 式 地 ,分 布 
项 数 已 , 定义 为 
F(z) = | XXX 中 委 二 的 个 数 | /n (1.4) 

它 称 为 样本 X1,…,X, 的 经 验 分 布 函 数 . 如 果 按 第 三 章 定义 2.2 
计算 分 布 ,的 & 阶 原点 矩 和 中 心 矩 , 则 分 别 得 到 cg 和 mm .所 以 ， 
样本 和 矩 无 非 就 是 经 验 分 布 的 和 矩 . 

特别 值得 注意 的 二 阶 中 心 矩 m2. 它 与 样本 方差 S? 只 相差 一 
个 常数 因子 :mm2 = 刀 一 S2， 

最 有 用 的 样本 矩 是 一 、 二 阶 的 ,三 .四 阶 的 也 有 些 应 用 .四 阶 以 
上 的 则 很 少 使 用 . / 

有 用 的 统计 量 很 多 ,它们 都 是 在 解决 种 种 统计 推断 问题 时 产 
生 的 ,以 后 将 结合 这 些 问 题 来 介绍 . 


4.2 和 矩 佑 计 、 极 大 似 然 估计 和 贝 叶 斯 估计 
4.2.1 参数 的 点 估计 问题 


设 有 一 个 统计 总 体 ,以 FLz ,9 ,6 ) 记 其 概率 密度 函数 (车 
总 体 分 布 为 连续 型 的 ) ,或 其 概率 函数 (车 总 体 分 布 为 离散 型 的 )， 
以 后 ,为 避免 每 次 重复 交代 这 两 种 情况 ,我 们 约定 称 fF(z ,9 ,…， 
Gi.) 为 "总体 分 布 ”, 其 具体 含义 视 其 为 连续 型 或 离散 型 而 定 .这 分 
布 包含 & 个 未 知 参 数 01 ,…, 0,. 例如 对 正 态 总 体 N(p ,0 ), 有 Oi 
= 人 ,92 一 0 而 
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f(r,01,0) = (2760) el- AE 一 91)?]， <r< 
若 总 体 有 二 项 分 布 B(n,p), 则 0|=p, 而 
f(r,0) = [ jal 一 01)7 7*,x = 0,1,.…,n 
并 

当 &=1, 即 只 有 一 个 参数 时 ,就 用 0 代 符 0 

参数 估计 问题 的 一 般 提 法 是 : 设 有 了 从 总 体 中 抽出 的 样本 
Xi X( 在 4.1 节 4.1.3 段 中 已 说 明 过 , 当 不 作 特 殊 申 明 时 , 样 
本 就 是 指 独立 随机 样本 , 即 XI1,，……,X, 独立 同 分 布 ,其 公共 分 布 就 
是 总 体 分 布 ) ,要 依据 这 些 样本 去 对 参数 0 ,… ,4 的 未 知 值 作 出 
估计 . 当然 ,我 们 也 可 以 只 要 求 估 计 0 …:& 中 的 一 部 分 ,或 估计 
它们 的 某 个 已 知 果 数 g(91,…,94). 例 如 ,为 要 估计 6, 我们 需要 
构造 出 适当 的 统计 量 01= 901(X!,…,XX, ). 每 当 有 了 样本 X,,…， 
X, ,就 代入 函数 0 (XX ,…, 叉 , ) 算 出 一 个 值 ,用 来 作为 0 的 估计 
值 .为 着 这 样 的 特定 日 的 而 构造 的 统计 量 91 ,叫做 (9 的 ) 估 计量 . 
由 于 未 知 参 数 91 是 数 轴 上 的 一 个 点 ,用 01 去 估计 01 ,等 于 用 一 个 
点 去 估计 男 一 个 点 ,所 以 这 样 的 估计 叫做 点 估计 ,以 别 于 将 在 4.4 
节 讨 论 的 区 间 估 计 . 

在 本 节 中 我 们 要 讨论 几 种 常用 的 点 估计 方法 ,这 些 方法 大 多 
是 基于 某 种 直观 上 的 考虑 . 同一 个 参数 往往 可 以 用 若干 个 看 来 都 
合理 的 方法 去 估计 .因此 有 一 个 判断 优 劣 的 问题 ,这 就 要 为 估计 量 
的 优 劣 制定 准则 ,进而 研究 在 某 种 准则 下 寻找 最 优 估 计量 的 问题 . 
这 就 是 参数 估计 这 个 数理 统计 学 分 支 的 重要 内 容 . 这 些 概 念 将 在 
以 后 作 更 具体 的 解释 . 


4.2.2 ”和 矩 估计 法 


算 估 计 法 是 KK. 皮尔 逊 在 上 世纪 末 到 本 世纪 初 的 一 系列 文章 
中 引进 的 .这 个 方法 的 思想 很 简单 : 设 总 体 分 布 为 f(z, 81,，…， 
六 ), 则 它 的 窍 ( 原 点 矩 和 中 心 定 都 可 以 ,此 处 以 原点 和 矩 为 例 ) 
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Q py = | 7m 丰 zyO 2)dz 


(或 2 xz?f(xi,0;,…, 4)) 


依赖 于 9 ,…,0,. 男 一 方面 ,至 少 在 样本 大 小 2 较 大 时 ,a,, 又 应 
接近 于 样本 原点 矩 a,, . 于 是 


Qn 一 am (O01,°*, 0.) 2 a,, 一 > XY /n 
1=1 


取 mw 二 1,…, 率 ,并 让 上 面 的 近似 式 改 成 等 式 , 就 得 到 个 方程 组 : 
ar(0 ,0) = an sm = 1,.…,k (2.1) 


解 此 方程 组 ,得 其 根 9, = 0,(Xi,*…, XX, ),i=1， “…,k. 就 以 0， 作为 
0; 的 估计 .i=1,…,&. 如 果 要 估计 的 是 61 ,…, 的 某 函 数 g (91， 


… ,9 ), 则 用 多 = 名 (XX1 ，…, 义 , ) = g(01,…,04) 去 估计 它 . 这 样 定 
出 的 估计 量 就 叫做 矩 估 计 . 

我 们 来 举 几 个 例子 说 明 这 个 方法 . 

例 2.1 设 Xi,…,X, 是 从 正 态 总 体 N(Cn,c2) 中 抽出 的 样 
本 ,要 估计 py 和 c2. w 是 总 体 的 一 阶 原点 矩 , 按 矩 估计 ,用 样本 一 
阶 原点 矩 即 样本 均值 四 去 估计 之 . c2 是 总 体 方差 , 即 总 体 二 阶 中 
心 矩 ,可 用 样本 二 阶 中 心 矩 m2 去 估计 .一 般 ,在 估计 方差 时 常用 
样本 方差 s? 而 不 用 m2, 即 对 和 矩 估 计 作 了 一 定 的 修正 .这 种 修正 的 
理由 将 在 下 节 中 指出 . 


如 果 要 估计 的 是 标准 差 oz, 则 由 o = vo, 按 条 估 计 法 , 它 可 


以 用 VY mm 去 估计 ,一般 用 Vs = s 去 估计 ,或 者 还 作 点 修正 ( 见 下 
节 ). 又 当 jy 关 0 时 (特别 在 jy>0 时 ,在 有 些 问 题 中 虽 未 知 ,但 事 
先 可 知 yx >>0. 如 例 1.2,yx 是 该 校 大 学 生 的 平均 成 绩 , 它 必须 大 于 
0) ,op 称 为 总 体 的 变异 系数 一 一 变异 系数 是 以 均值 为 单位 去 衡 
量 的 总 体 的 标准 差 .在 有 些 问题 中 ,反映 变异 程度 的 标准 差 意义 如 
何 , 要 看 总 体 均 值 wp 而 定 . 比如 一 大 群 人 收入 的 标准 差 为 50 元 . 
若 其 平均 工资 只 有 70 元 , 则 这 个 变异 程度 可 算 很 大 了 .但 车 平均 
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二 资 为 850 元 , 则 这 变异 程度 不 算 大 .所 以 ,变异 系数 cu 不 过 定 
一 定 意义 下 的 “相对 误差 ”. 按 和 矩 法 ,为 估计 cjw ,可 用 V m2/X ,一 
般 用 s A/X. 

例 2.2 设 XX!,…,X, 是 从 指数 分 布 总 体 中 抽出 的 样本 ,要 
估计 参数 4 的 倒数 1A4. 前 已 指出 :1/4 就 是 总 体 分 布 的 均值 , 故 
按 和 矩 法 ,就 用 X 去 估计 之 .如 要 估计 的 是 参数 本 身 , 就 用 1/X. 

另 一 方面 ,如 在 第 三 章 例 2.5 中 指出 的 ,指数 分 布 的 方差 为 
1 , 即 1 和 =Vv 总 体 二 阶 中 心 息 . 按 矩 法 ,1AA 也 可 以 用 V m2( 或 
*) 去 估计 .这 个 估计 与 X 哪 个 更 好 ? 这 就 是 需要 研究 的 问题 , 见 下 
节 

例 2.3 设 Xi，…,X， 是 入 区 门 -12 上 上 汐 匀 分 布 的 党 人 
中 抽出 的 样本 ,要 估计 0 ,02. 

前 已 指出 ( 见 第 三 章 例 1.3 和 例 2.5). 这 总 体 分 布 的 均值 方 
差分 别 为 (6 + 9,)/2 和 (0, 一 91)*/12. 因 此 按 和 矩 法 ,建立 方程 
= (0 +0)/2,m> = (0, — 01)/12 


得 出 901,0, 的 解 961,6, 分 别 为 


-V3m ,0» 二 站 十 3m> (2.2) 
也 可 以 用 s 代替 212.， 
例 2.4 在 第 三 章 (2.8),(2.9) 式 中 曾 定义 了 分 布 的 偏 度 系 


数 81 一 -35 及 峰 度 系数 Ba 一 (或 8, 一 3) ,并 阐述 了 它 的 意义 . 根 
2 2 


3 和 去 估计 之 ， 

本 例 与 前 几 例 不 同 之 处 在 于 : 它 并 不 要 求 总 体 分 布 有 特定 的 
参数 形式 ,如 正 态 分 布 , 指 数 分 布 之 类 . 总体 分 布 为 任何 分 布 都 可 
以 ,只 要 其 三 阶 ( 对 Bi) 或 四 阶 (对 8B,) 矩 存在 就 行 . 凡是 被 估计 的 
对 象 能 直接 用 矩 表达 出 来 时 ,都 属于 这 种 情况 ,其 中 最 重要 的 例子 
是 均值 方差 .只 要 总 体 分 布 的 均值 方差 存在 , 则 总 可 以 用 样本 均值 
XX 或 样本 方差 S: 去 估计 之 ,而 不 论 其 分 布 有 如 何 的 形式 .不 过 ,在 
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总 体 分 布 已 知 有 某 种 参数 形式 时 , 总 体 的 均值 方差 也 可 以 有 比 义 
或 S$ 更 好 的 估计 ( 见 后 面 有 关 的 例子 ). 

例 2.5 设 总 体 有 二 项 分 布 B(N,p),XX|,…,X, 为 从 该 总 
体 中 抽出 的 样本 .要 估计 p ,和 矩 估计 为 XA/N. 

例 2.6 设 总 体 有 波 哇 松 分 布 P(A),X1,…,X, 为 从 该 总 体 
中 抽出 的 样本 ,要 估计 外. 

由 于 4 是 总 体 分 布 的 均值 , 按 矩 估计 法 ,用 样本 均值 X 去 估计 
之 ; 男 一 方面 ,4 也 是 总 体 分 布 的 方差 , 故 按 和 矩 法 ,也 可 以 用 mm， 或 
S- 去 估计 .这 又 有 一 个 优 劣 的 问题 .对 本 例 及 例 2.2 来 说 ,在 合理 
的 准则 下 ,都 可 以 证 明 用 样本 均值 X 为 优 .在 一 般 情况 下 通常 总 是 
采取 这 样 的 原则 :能 用 低 阶 矩 处 理 的 就 不 用 高 阶 和 矩 . 


4.2.3 极 大 似 然 估 计 法 


设 总 体 有 分 布 FLX; 0 ,2 ), Xi,X， 为 自 这 总 体 中 抽 
出 的 样本 , 则 样本 (Xi ,…,X, ) 的 分 布 ( 即 其 概率 密度 函数 或 概率 
画 数 ) 为 
太 X10 pb) CCX250 0 F(X, 0 0 ) 
记 之 为 L(X1,, X,;01,.…,0,). 
固定 01,…, 0; 而 看 作 是 XX ,…,X, 的 函数 时 ,上 是 一 个 概率 
密度 函数 或 概率 消 数 ,可 以 这 样 理解 : 若 L(Y1,, Yn ;01,°", Gi) 
>L(Xi,…,Xa;01,… ,9 ), 则 在 观察 时 出 现 ( YY),…,Y, ) 这 个 点 
的 可 能 性 ,要 比 出 现 (X1,…,X, ) 这 个 点 的 可 能 性 大 . 把 这 件 事 反 
过 来 说 ,可 以 这 样 想 : 当 已 观察 到 XX ,…,X, 时 ,车 L(X1,…,X,; 
O104)>>L(XI,…, XX,;01,…,0%), 则 被 估计 的 参数 (01， 
,级 ) 是 (01，…, 4) 的 可 能 性 ,要 比 它 是 (07,…,%) 的 可 能 性 大 . 
当 XX ,…, XX, 固定 而 把 L 看 作 0 ,和 的 函数 时 , 它 称 为 
“ 似 然 函 数 ”. 这 名 称 的 意义 ,可 根据 上 述 分 析 得 到 理解 :这 函数 对 
不 同 的 (01 ,…, 6) 的 取 值 ,反映 了 在 观察 结果 (XX ,…, X,) 已 知 的 
条 件 下 ,(01,…,04) 的 各 种 值 的 “ 似 然 程 度 ”. 注意 这 里 有 些 像 贝 叶 
”162 。 


斯 公式 中 的 推理 ( 见 第 一 章 (3.18) 式 ): 把 观察 值 Xi,，…,X, 看 成 
结果 而 参数 信 (01 ,外 ?看 成 是 导致 这 结果 的 原因 . 现 已 有 本 结 
果 ,要 反 过 来 推算 各 种 原因 的 概率 .这 里 参数 0 ,…, 9 有 一 定 的 
值 (虽然 未 知 ), 并 非 事 件 或 随机 变量 ,无 概率 可 言 ,于 是 就 改 用 “ 似 
然 " 这 个 词 . 

从 上 述 分 析 就 自然 地 导致 如 下 的 方法 :应 该 用 似 然 程度 最 大 
的 那个 点 (697 ,…,9# ), 即 满足 条 件 

L(Xi1,,X,;07 ,""* ,OF ) 
= axL (Xi Xs O01, Ok) (2.3) 


的 (967 ,…,02 ) 去 作为 (01,…, 98) 的 估计 值 ,因为 在 已 得 样本 X ，， 
…,XX, 条 件 下 ,这 个 “看 来 最 像 "是 真 参数 值 . 这 个 估计 (9* ,… 
bz) 就 叫做 (6 ,6,) 的 “ 极 大 似 然 估 计 ”. 如果 要 估计 的 是 g(8 ， 
… 04), 则 g(07 ,…,07 ) 是 它 的 极 大 似 然 估计 . 

因为 


logL = logf (Xis01,., Ok) (2.4) 


且 为 使 工 达到 最 大 ,只 须 使 logL 达到 最 大 , 故 在 上 对 20，…,6 存 
在 连续 的 偏 导数 时 ,可 建立 方程 组 ( 称 为 似 然 方 程 组 ): 
9 = 0,7 = 1，… ,上 (2.5) 

如 果 这 方程 组 有 唯一 的 解 ,又 能 验证 它 是 一 个 极 大 和 值 点 , 则 它 必 是 
使 二 达到 最 大 之 点 , 即 极 大 似 然 估 计 . 在 几 个 常见 的 重要 例子 中 
这 一 点 不 难 验证 .可 是 ,在 较 复杂 的 场合 ,方程 组 (2.5) 可 以 有 不 下 
一 组 解 , 求 出 这 些 解 很 费 计 算 , 生 不 易 判 定 那 一 个 使 上 达到 最 大 . 

有 了 时 ,函数 f 并 不 对 0 ,… ,0， 可 导 , 其 至 本身 也 不 连续 ,这 
时 方程 组 (2.5) 就 无 法 用 ,必须 回 到 原始 的 定义 2.3. 

现 举 一 些 例子 来 说 明 求 极 大 似 然 估计 的 过 程 . 

例 2.7 设 X,…,X, 是 从 正 态 总 体 N(y,o) 中 抽出 的 样 
本 , 则 似 然 函数 为 
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r= | (Var) exp(- 303(X; — 4) )] (2.6) 


i=! 
1 ~ 2 
logL =— 7 log(27) 一 7 log(o”) 一 Pt 一 KM) 


求 方程 组 (2.5)( 把 o? 作为 一 个 整体 看 ) 
el =- 二 > (Xi -mA) =0 


9p 0 
9jogL n lv 
3(0) ~ 253 + 32012 (XA) 70 


由 第 一 式 得 出 Ap 的 解 为 
HA ”一 > Xin = X 
以 此 代入 第 二 式 的 六 ,得 到 六 的 解 为 
5*2 = D(x — X)/n = m2 


我 们 看 到 :y 与 o? 的 极 大 似 然 估计 y* 和 c 汪 ,与 其 矩 估 计 完 全 一 
样 .在 本 例 中 ,容易 肯定 (jy* ,co *“) 确 是 使 似 然 函数 上 L 达 得 最 大 值 
之 点 .因为 , 似 然 方 程 组 只 有 了 唯一 的 根 (y* ,eo*“*), 而 这 个 点 不 可 
能 是 工 的 极 小 值 点 .因为 ,由 工 的 表达 式 (2.6) 可 知 , 当 | | 一 
或 o>0 时 ,L 趋向 于 0, 而 工 在 每 个 点 处 都 大 于 0. 以 下 几 个 例 
子 都 可 以 按照 这 个 方式 去 验证 ,我 们 就 不 一 一 重复 了 . 

例 2.8 设 Xi,…,X, 是 从 指数 分 布 总 体 中 抽出 的 样本 , 求 
”参数 4 的 极 大 似 然 估 计 . 

有 


L = 几 (MAe 全 
i=1 


logL = nlogA 一 人 >) xX, 
i=1 


得 4 的 极 大 似 然 估计 为 
A” 二 na/ > X = 17X 
仍 与 其 矩 估 计 一 样 .但 是 在 这 里 , 极 大 似 然 估计 只 有 一 个 ,而 如 在 
例 2.2 中 所 指出 的 ,4 的 矩 估计 依 使 用 不 同 阶 的 矩 , 可 以 有 几 个 . 
例 2.9 设 X!,…,X, 是 从 均匀 分 布 R(0,9) 的 总 体 中 抽出 
的 样本 , 求 6 的 极 大 似 然 估 计 . 
X; 的 密度 函数 为 1/0, 当 0<X,;<09, 此 外 为 0. 故 似 然 函数 工 
为 
-1 当 0 < X; < 0,i = 1,,n 
” 【0， ”其 他 情况 
对 固定 的 XI ,…,XX, ,此 哨 数 为 9 的 间断 图 数 , 故 无 法 使 用 似 然 方 
程 (2.5). 但 此 例 不 难 直 接 用 最 初 的 定义 2.3 去 解决 ;为 使 上 达到 
最 大 ,9 必须 尽量 小 ,但 又 不 能 太 小 以 致 L 为 0. 这 界线 就 在 9* = 
max( 久 1,… ,XX, ) 处 : 当 0 宇 0* 时 ,上 大 于 0 有 目 为 90 ". 当 0<0* 
时 , 为 0. 改 唯一 使 工 达到 最 大 的 9 值 , 即 6 的 极 大 似 然 估计 ,为 
0”. 
如 条 用 乍 估计 法 , 则 因 总 体 分 布 的 均值 为 9 人 ,6 的 矩 估计 为 
9 =2 XX. 这 两 个 估计 的 优 劣 比较 将 在 后 面 讨论 . 
例 2.10 再 考虑 例 2.5, 有 


2” N\| ~ 
r= 十 | Rp 


拉 N + nn 
logL = 2 os 十 2 X,logp + 2 (N— X;)log(l ~ ») 
作 方 程 


Se = = Xi (aN - > Xx)1 =0 
此 方程 之 能 p 的 极 天 似 然 估计 ， 为 5=X/LN, 与 矩 估计 相 
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同 . 

例 2.11 考虑 例 2.6. 容 易 证 明 :， 的 极 大 似 然 估计 4*=XX 
与 和 矩 估 计 相 同 . 

在 我 们 所 举 的 这 些 例子 中 (这 些 例 子 都 是 在 应 用 上 最 常见 
的 ), 和 矩 估 计 与 极 大 似 然 估 计 在 多 数 情 况 下 一 致 .这 更 多 地 是 一 种 
巧合 ,并 非 一 般 情 形 .有 意思 的 是 :在 这 些 例 子 中 这 两 种 估计 方法 
结果 一 致 ,说 明 这 些 估计 是 良好 的 . 这 一 点 当然 还 需要 一 定 的 理论 
证 明 . 

也 有 这 样 的 情况 ,用 这 两 个 估计 方法 都 行 不 通 或 不 易 实行 .下 
面 是 一 个 例子 . 

例 2.12 设 总 体 分 布 有 密度 困 数 


1 
f(x,0) = rl[l+(x-0)]’ 


这 分 布 包含 一 个 参数 6,6 可 取 任 何 实数 值 . 这 分 布 叫 柯 西 分 布 ， 
其 密度 作为 x 的 函数 ,关于 9 点 对 称 . 故 9 是 这 个 分 布 的 中 位 数 
( 见 第 三 章 3.1.4). 

现 设 Xi ,…,X, 为 自 这 总 体 中 抽出 的 样本 ,要 估计 9. 由 于 


| lzlf(z,0)dz 一 co 


柯 西 分 布 的 一 阶 矩 也 不 存在 ,更 不 用 说 更 高 阶 的 矩 了 .因此 ,和 矩 估 
计 无 法 使 用 . 知 用 极 大 似 然 法 , 则 将 得 出 方程 
"X09 
2 1+(X — 0) 9 
这 方程 有 许多 根 且 求 根 不 容易 .因此 ,对 本 例 而 言 , 极 大 似 然 法 也 
不 是 理想 的 方法 . 
为 估计 参数 6, 有 一 个 较 简 单 易 行 但 看 来 合理 的 方法 可 用 .这 
个 方法 是 基于 6 和 公休 公有 的 中 位 数 这 个 事实 ， 既 如 此 ,我 们 就 
要 设法 在 样本 X|,…,X, 中 找 一 种 对 应 于 中 位 数 的 东西 .这 个 思 
想 其 实在 矩 估计 法 中 就 已 用 过 ， 因为 总 体 矩 在 样本 中 的 对 应 物 就 
是 样本 和 矩 . 
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-<r<™ (2.7) 


现在 把 Xi,…，,X, 按 由 小 到 大 排 成 一 列 ， 

X0) Xo0) SAX) (2.8) 
它们 称 为 次 序 统计 量 .既然 中 位 数 是 “居中 "的 意思 ,我 们 就 在 样本 
中 找 居 中 者 : 

_ 1 n 为 奇数 时 
i (Xo2) 二 六 (n2+1) ) 人 2, 当 nn 为 偶数 时 
当 ?为 奇数 时 ,有 一 个 居中 者 为 Xi ;1)pp); 敬 n 为 偶然 ,就 没有 
一 个 居中 者 ,就 把 两 个 最 居中 者 取 平 均 , 这样 定义 的 所 叫 作 “ 样 本 
中 位 数 ”. 我 们 就 拿 大 作为 9 的 估计 . 

就 正 态 总 体 N(y,o”) 而 育 ,pw 也 是 总 体 的 中 位 数 , 故 wx 也 可 
以 用 样本 中 位 数 去 估计 .从 这 些 例 子 中 ,我 们 看 出 一 点 :统计 推断 
问题 的 解 ,往往 可 以 从 许多 看 来 都 合理 的 途径 去 考虑 ,并 无 一 成 不 
变 的 方法 ,不同 解 固然 有 优 劣 之 分 ,但 这 种 优 劣 也 是 相对 于 一 定 的 
准则 而 言 .并 无 绝对 的 价值 .下 述 情况 也 并 非 不 常见 :估计 甲 在 某 
一 准则 下 优 于 乙 ,而 乙 又 在 另 一 准则 下 优 于 甲 . 

极 大 似 然 估计 法 的 思想 , 始 于 高 斯 的 误差 理论 ,到 1912 年 由 
R. A. 费 软 尔 在 一 篇 论文 中 把 它 作 为 一 个 一 般 的 估计 方法 提出 
来 . 自 20 年 代 以 来 , 费 软 尔 自 己 及 许多 统计 学 家 对 这 一 估计 法 进 
行 了 大 量 的 研究 .总 的 结论 是 :在 各 种 估计 方法 中 ,相对 说 它 一 般 
更 为 优良 ,但 在 个 别 情况 下 也 给 出 很 不 理想 的 结果 .与 矩 估计 法 不 
同 , 极 大 似 然 估计 法 要 求 分 布 有 参数 的 形式 . 比方 说 ,如 对 总 体 分 
布 各 无 所 知 而 要 估计 其 均值 方差 , 极 大 似 然 法 就 无 能 为 力 . 


4.2.4 贝 叶 斯 法 


贝 叶 斯 学 派 是 数理 统计 学 中 的 一 大 学 派 .在 这 一 段 中 ,我 们 简 
略 地 介绍 一 下 这 个 学 派 处 理 统计 问题 的 基本 思想 . 
拿 我 们 目前 讨论 的 点 合计 问题 来 说 ,无 论 你 用 和 矩 估计 也 好 ,用 
极 大 似 然 鸽 计 或 其 他 方法 也 好 ,在 我 们 心目 中 ,未 知 参数 9 就 简 
单 地 是 一 个 未 知 数 ,在 抽取 样本 之 前 ,我 们 对 9 没有 任何 了 解 , 所 
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有 的 信息 全 来 自 样 本 . 

贝 叶 斯 学 派 则 不 然 , 它 的 出 发 点 是 :在 进行 抽样 之 前 ,我 们 已 
对 9 有 一 定 的 知识 ,叫做 先 验 知识 . 这 里 “ 先 验 ”的 意思 并 非 先 验 
论 ,而 只 是 表示 这 种 知识 是 “在 试验 之 先 "就 有 了 的 ,也 有 人 把 它 叫 
做 验 前 知识 , 即 “ 在 试验 之 前 ”的 意思 . 

贝 叶 斯 学 派 进 一 步 要 求 : 这 种 先 验 知 识 必须 用 0 的 某 种 概率 
分 布 表 达 出 来 ,这 概率 分 布 就 叫做 9 的 “ 先 验 分 布 " 或 “ 验 前 分 
布 .这 个 分 布 总 结 了 我 们 在 试验 之 前 对 未 知 参 数 0 的 知识 . 

举 一 个 例子 . 设 某 工厂 每 日 生产 一 大 批 某 种 产品 ,我们 想 要 估 
计 当 日 的 废品 率 0. 该 厂 在 以 前 已 生产 过 很 多 批 产 品 ,如 果 过 去 的 
检验 有 记录 在 , 则 它 确实 提供 了 关于 废品 率 6 的 一 种 有 用 信息 ， 
据 此 可 以 画 出 6 的 密度 曲线 ,如 图 4.1(a),(b). 


bh(0) h(0) 


(a) (b) 


图 4.1 


图 中 h (09) 表示 9 的 密度 函数 ,0 过 9 世 1. (a) 表 示 一 个 较 好 的 
情况 :h(9) 在 9=0 附近 很 大 而 当 6 增加 时 ,下 降 很 快 . 这 表示 该 
上 以往 的 废品 率 通常 都 很 低 . (b) 则 表示 一 个 不 大 好 的 情况 :比较 
大 的 废品 率 出 现 的 比率 相当 高 . 容易 理解 :这 种 关于 9 的 历史 知 
识 ( 即 先 验 知识 ), 在 当前 估计 废品 率 9 时 ,应 适当 地 加 以 使 用 而 
不 应 弃 之 不 顾 . 这 种 思想 与 我 们 日 常 处 事 的 习惯 符合 : 当 我 们 面临 
一 个 问题 时 , 除 考 虑 当前 的 情况 外 ,往往 还 要 注意 以 往 的 先例 和 经 
验 . 

问题 就 来 了 :如 果 这 个 工厂 以 往 没 有 记录 ,或 甚至 是 一 个 新 开 
工 的 工厂 ,该 怎么 办 ? 怎样 去 获得 上 文 所 指 的 先 验 密度 (20)? 贝 
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叶 斯 统计 的 一 个 基本 要 求 是 :你 必须 设法 去 定 出 这 样 一 个 疡 (6)， 
甚至 出 于 你 自己 的 主观 认识 * 也 可 以 ,这 要 成 为 问题 中 一 个 必 备 
的 要 素 . 正 是 在 这 一 点 上 , 贝 叶 斯 统计 遭 到 不 少 的 反对 和 批评 ,而 
一 个 初 接触 这 个 问题 的 人 ,也 容易 这 样 想 :这 怎么 行 ? 我 没有 根 
据 怎么 能 赁 主观 想像 去 定 出 一 个 先 验 密度 疡 (6)”. 关 于 这 一 点 , 贝 
叶 斯 学 派 的 信奉 者 有 自己 的 一 套 说 法 ,这 问题 非 三 言 两 语 能 说 清 
楚 . 本 书 作 者 有 一 篇 通俗 形式 的 文章 ( 见 《数理 统计 与 应 用 概率 》 
1990 年 第 四 期 ,p.389 一 400) ,其 中 对 这 个 问题 及 有 关 问 题 作 了 仔 
细 说 明 ,有 兴趣 的 读者 可 以 参考 ， 

现在 我 们 转 到 下 一 个 问题 :已 定 下 了 先 验 密度 之 后 ,怎样 去 得 
出 参数 9 的 估计 . 

设 总 体 有 概率 密度 /(X ,0)( 或 概率 函数 , 若 总 体 分 布 为 离散 
的 ) ,从 这 总 体 抽样 本 Xi,…，,X。, 则 这 样本 的 密度 为 /(X1,0)…/ 
(X,,0). 它 可 视 为 在 给 定 9 值 时 (Xi,…,X,) 的 密度 ,根据 第 二 章 
(3.5) 式 及 该 式 下 的 一 段 说 明 ,(0,X|,…,X, ) 的 联合 密度 为 

h(0)f(X1,0)… f(X, ,0) 

由 此 ,算出 (X1,…,X, ) 的 边缘 密度 为 


p(X1°7, Xs) = |n(O) FOX1,0)- F(X,,0)d0 (2.10) 


积分 的 范围 ,要 看 参数 9 的 范围 而 定 . 如 上 例 9 为 废品 率 , 则 0 入 6 
碾 1. 夺 0 为 指数 分 布 中 的 参数 A, 则 0<9< co ,等 等 .由 (2.10) ,再 
根据 第 二 章 的 公式 (3.4), 得 到 在 给 定 XX ,…,X, 的 条 件 下 ,9 的 
条 件 密 度 为 
h(OIX1,**, X,) = h(O)f(X1,0)° fCX, ,0) /p(X1,.…, X,) 
(2.11) 
照 见 叶 斯 党派 的 观点 ,这 个 条 件 密度 代表 了 我 们 现在 ( 即 在 取得 样 
本 XX1,…,X 后 ) 对 0 的 知识 , 它 综 合 了 9 的 先 验 信息 (以 及 (0) 反 
映 ) 与 由 样本 带 来 的 信息 .通常 把 (2.11) 称 为 9 的 “后 验 (或 验 后 ) 


* 就 是 说 ,这 里 允许 使 用 主观 概率 , 见 第 一 章 1.1 节 . 
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密度 ,因为 他 是 在 做 了 试验 以 后 才 取 得 的 . 

如 采 把 上 述 过程 和 我 们 在 第 一 章 中 讲 过 的 贝 叶 斯 公式 相 比 ， 
就 可 以 理解 :现在 我 们 所 做 的 ,可 以 说 不 过 是 把 贝 叶 斯 公式 加 以 
-连续 化 而 已 ,看 下 表 中 的 比较 . 


事件 BI,…, B, | P(B1)， 
中 那 一 个 发 生 了 ? | …,P(B,) 


由 这 里 我 们 就 理解 到 ,为 什么 一 个 看 来 不 起 眼 的 贝 叶 斯 公式 会 有 
如 此 大 的 影响 .这 一 点 我 们 在 第 一 章 中 已 有 所 论述 了 . 

贝 叶 斯 学 派 的 下 一 个 重要 观点 是 :在 得 出 后 验 分 布 (2.11) 后 ， 
对 参数 6 的 任何 统计 推断 ,都 只 能 基于 这 个 后 验 分 布 .至 于 具体 
如 何 去 使 用 它 ,可 以 结合 某 种 准则 一 起 去 进行 ,统计 学 家 也 有 一 定 
的 目 由 度 . 拿 此 处 讨论 的 点 估计 问题 来 说 ,一 个 常用 的 方法 是 : 取 
后 验 分 布 (2.11) 的 均值 作为 6 的 估计 . 

还 有 一 点 需要 说 明 一 下 : 按 上 文 ,h (9) 必须 是 一 个 密度 函数 ， 


即 必须 满足 h(0) 之 0, |h(9)d9 =1 这 两 个 条 件 .但 在 有 些 情况 


后 验 (现在 ) 知 识 
P(BI A),…, 
P(B,.|A) 


后 验 密度 (2.11) 


事件 A 发 生 了 


此 处 的 问题 


下 ,An(9)>>0, 但 |h(6)d9 不 为 1 甚至 为 co ,不 过 积分 (2.10) 仍 有 
限 ,这 时 ,由 (2.11) 定 义 的 (90| Xl,…,X,) 作 为 9 的 函数 , 仍 满足 
密度 函数 的 条 件 .这 就 是 说 ,即使 这 样 的 h(9) 取 为 先 验 密度 也 无 


妨 . 当然 ,由 于 |h(9)d9 不 为 1, 它 已 失去 了 密度 函数 的 通常 的 概 
率 意义 .这 样 的 A(9) 通 常 称 为 “广义 先 验 密度 ” 
例 2.13 作 ”次 独立 试验 ,每 次 观察 某 事件 A 是 否 发 生 , A 
在 每 次 试验 中 发 生 的 概率 为 p, 要 依据 试验 结果 去 估计 p. 
这 问题 我 们 以 往 就 “用 频率 估计 概率 "的 方法 去 处 理 (这 也 是 
它 的 矩 估计 与 极 大 似 然 估计 ). 这 方法 不 用 p 的 先 验 知识 .现在 我 
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们 用 贝 叶 斯 统计 的 观点 来 处 理 这 个 问题 . 
引进 X; = 1 或 0, 视 第 i 次 试验 时 A 发 生 与 否 而 定 ,i=1,…， 
n.P(X,=1) 一 p,P(X,=0) =]—p. 因此 (X!,…,X,) 的 概率 孙 


数 为 疡 (1-p)"-*，X = >) Xi . 取 思 的 先 验 密度 h( 思 ), 则 思 的 


后 验 密 度 为 
hl(p [X11,.…,X,) 


4 
=h (pp p)" /| Ap PY" dp 0 <p<1 
此 分 布 的 均值 为 
B= DXi Xa) = | ph(PIX1,, Xa)dp 


1 1 
= | (pp - p)" sdp/| hp) pr 一 旋 ) “dp 
(2.12) 
就 是 p 在 先 验 分 布 h(p) 之 下 的 贝 叶 斯 估计 . 

如 何 选 择 h(p)? 贝 叶 斯 本 人 曾 提出 “同等 无 知 ” 的 原则 , 即 
事先 认为 p 取 [0,1j] 内 一 切 值 都 有 同等 可 能 ,就 是 说 取 [0,1] 内 均 
习 分 布 R(0,1) 作 为 p 的 先 验 分 布 .这 时 hh(p)=1 当 0 委 2 和 1 ,而 
(2.12) 中 的 两 个 积分 都 可 以 用 8 函数 表 出 ( 见 第 二 章 (4.22) 式 ). 
由 此 得 

p=BX+2,n— X+1)/B(X+1,n- X+1) (2.13) 

根据 B 昌 数 与 申 数 的 关系 式 (4.25), 以 及 当 上 为 自然 数 时 

Tn(k)= (一 1)1, 由 (2.13) 不 难得 到 


p= (X+1)/n+2) (2.14) 

这 个 估计 与 频率 XX/n 有 些 差 别 , 当 2 很 大 时 不 显著 ,而 在 ”很 小 

时 颇 为 显著 .从 一 个 角度 看 , 当 n 相当 小 时 ,用 贝 叶 斯 估计 (2.14) 

比 用 X/n 更 合理 .因为 当 ”很 小 时 ,试验 结果 可 能 出 现 X=0 或 

X=7 的 情况 .这 时 , 依 多 /nn 应 把 p 估计 为 0 或 1, 这 就 太极 端 了 

(我 们 不 能 仅 根 据 在 少数 几 次 试验 中 A 会 不 出 现 或 全 出 现 , 就 判 
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定 它 为 不 可 能 或 必然 ). 若 按 (2.14) , 则 在 这 两 种 情况 下 分 别 给 出 
估计 值 1Mz +2) 和 (n+1)/A(n+2). 这 就 留 有 一 定 的 余地 . 

这 个 “同等 无 知 ” 的 原则 ,又 称 贝 叶 斯 原则 ,被 广泛 用 到 一 些 其 
他 的 情况 .不 过 随 着 所 估计 的 参数 的 范围 和 性 质 的 不 同 , 该 原则 的 
具体 表现 形式 也 不 同 .例如 ,为 估计 正 态 分 布 N(x4,o ) 中 的 4, 辣 
等 无 知 原则 给 出 一 个 广义 先 验 密度 六 (ww) 三 1. 若 估计 c, 则 应 取 
h(ao)=o-'(o>>0). 若 估计 指数 分 布 中 的 和 4, 则 取 (43)=XA-1(X 
>0). 这 些 都 是 广义 先 验 密度 .其 所 以 这 样 做 的 理由 ,不 能 在 此 处 
细 谈 了 . z 

这 个 原则 也 受到 一 些 批评 ,其 中 最 有 力 的 批评 是 其 不 确定 性 . 
理由 是 : 拿 本 例 的 p 来 说 , 若 对 p 同等 无 知 , 则 对 p?*( 或 p3,p4,… 
等 ) 也 应 是 同等 无 知 ,因而 也 可 以 把 p? 的 密度 函数 取 为 R(0,1) 
的 密度 ,这 时 不 难 算出 p 的 密度 将 为 h(p)=2p( 当 0 志 p 志 1, 其 
外 为 0) ,与 本 例 所 给 不 一 致 .另外 ,不 言 而 喻 ,同等 无 知 的 原则 是 
一 个 在 确实 没有 什么 信息 时 ,不 得 已 而 采用 的 办 法 .在 实际 问题 
中 ,有 时 是 存在 更 确实 的 信息 的 ,如 本 段 开 始 讲 到 的 那个 估计 废品 
率 的 情况 . 又 如 ,估计 一 个 基本 上 均匀 的 铜板 在 投掷 时 出 现 正 面 的 
概率 户 . 我 们 有 理由 事先 肯定 p 离 1 人 2 不 远 . 这 时 ,可 考虑 取 一 个 
适当 的 数 e>>0, 而 把 p 的 先 验 分 布 取 为 [1 人 2 -e,12+e] 内 的 均 
匀 分 布 .这 肯定 比 用 同等 无 知 的 原则 效果 要 好 ,尤其 是 在 试验 次 数 
n 不 大 时 ， 

例 2.14 设 X,…,X, 是 自 正 态 总 体 N(9,1) 中 抽出 的 样 
本 .为 估计 9, 给 出 8 的 先 验 分 布 为 正 态 分 布 N(y,o?)(,o? 当然 
都 已 知 ). 求 9 的 贝 叶 斯 估计 .在 本 例 中 有 


h(0)= (V3ro) lexp[- 33(0 - 1)| 
f(x,0)= (V 玩 ) exp[ -3(7z- 0)|. 
故 按 公 式 (2.11) 知 ,9 的 后 验 密 度 为 
h(OIX1,…,X,) = exp| - 73(0 — py) — 方 (X 一 9): |/1 


(2.15) 
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其 中 了 是 一 个 与 0 无 关 而 只 与 wac ,Xi …,X 有 关 的 数 . 简单 的 
代数 计算 表明 


-二 -0 
i=1 


(2.16) 

其 中 
t = (nX+p/o)/(n + 1/0°) (2.17) 
7 = 1/(n +1/0’) (2.18) 


而 了 与 9 无 关 . 以 (2.16) 代 入 (2.15), 得 
1 
h(0|X1,…,X,) = Tiexp| — 2 一 站 2 | 


这 里 = 大 与 9 无关. 了 工 不 必 直 接 算 , 因 为 ,h (90|Xi,…,XX, ) 作 
为 0 的 函数 是 一 个 概率 密度 函数 , 它 必须 满足 条 件 


| n(OIXi,…, X,)d9 = 1 


这 就 决定 了 i= (V2xm) !. 因此 ,6 的 后 验 分 布 就 是 正 态 分 布 
N(z 72) ,其 均值 上 就 是 9 的 贝 叶 斯 估计 6: 


6 = 1 = 一 瑟 广 + 


n+l/o (2.19) 


1/0* 
Nn 十 1/o27 
把 6 写成 (2.19) 的 形状 很 有 意思 . 设想 两 个 极端 情况 :一 个 是 
只 有 样本 信息 而 毫 无 先 验 信 息 ,这 就 是 我 们 以 前 讨论 的 情况 ,这 时 
用 样本 均值 X 去 估计 0. 另 一 个 是 只 有 上 先 验 信息 N(Cw,c2) 而 没有 
样本 . 这 时 ,我 们 只 好 用 先 验 分 布 的 均值 w 作为 9 的 估计 . 由 
(2.19) 式 看 出 : 当 两 种 信息 都 存在 时 ,9 的 估计 为 二 者 的 折衷 . 它 
是 上 述 两 个 极端 情况 下 的 估计 久 和 jy 的 加 权 平 均 , 权 之 比 为 n :17 
.这 个 比值 很 合理 : ” 为 样本 数目 ,” 愈 大 ,样本 信息 愈 多 , 斑 的 
权 就 该 更 大 .对 jy 而 言 ,其 重要 性 则 要 看 o? 的 大 小 . cz 您 大 ,表示 
先 验 信息 愈 不 肯定 (6 在 jy 周围 的 散布 很 大 ). 反 之 ,o? 很 小 时 , 仅 
根据 先 验 信息 ,已 有 很 大 把 握 肯 定 9 在 jy 附近 不 远 处 .因此 ,w 的 
权 应 与 a? 成 反比 .公式 (2.19) 恰 好 体现 了 上 述 分 析 . 
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目前 在 国际 统计 界 及 应 用 统计 工作 者 中 , 贝 叶 斯 学 派 已 有 很 
大 影响 .其 原因 在 于 它 确实 有 一 些 别 的 方法 所 不 具备 的 优点 .这 些 
在 今后 我 们 还 将 看 到 .在 我 国 , 贝 叶 斯 方法 也 开始 受到 重视 并 得 到 
一 些 应 用 .对 把 数理 统计 学 方法 作为 一 种 工具 的 应 用 工作 者 来 说 ， 
对 这 个 学 派 的 方法 有 必要 有 一 定 的 了 解 . 


4.3 ” 扩 售 计 的 优良 性 准则 


从 前 市 的 例子 中 我 们 累累 看 到 :同一 个 参数 往往 有 不 止 一 种 
看 来 都 合理 的 估计 法 .因此 ,自然 会 提出 其 优 劣 比较 的 问题 . 

初 一 看 觉得 这 个 问题 很 容易 回答 : 设 0, 和 606, 两 个 估计 量 都 
用 于 佑 计 0, 则 看 哪 一 个 的 误差 小 ,就 哪 一 个 为 优 .但 是 ,由 于 6 本 
身 未 知 ,就 不 知道 估计 误差 有 多 大 ,这 还 不 是 最 主要 的 .主要 问题 
在 于 :01,0; 之 值 都 与 样本 有 关 . 一 般 情况 是 :对 某 些 样本 ,61 的 
误差 小 于 9, 的 误差 ,而 对 另 一 些 样本 则 反之 . 一 个 从 整体 上 看 不 
好 的 估计 ,在 个 别 场 合 下 可 能 表现 很 好 .反之 ,一 个 很 不 错 的 估计 ， 
由 于 抽 到 了 不 易 出 现 的 样本 ,其 表现 也 可 以 很 差 . 如 例 1.2 估计 学 
生 学 习 成 绩 ( 以 其 考分 衡量 ) 的 问题 ,大 家 都 会 同意 :如 抽出 100 个 
学 生 , 以 其 平均 成 绩 作 为 估计 值 , 比 以 抽出 的 第 一 个 学 生 的 成 绩 作 
为 佑 计 值 要 好 .但 也 可 以 发 生 这 种 情况 :所 抽 第 一 个 学 生 的 成 绩 很 
接近 于 全 校 总 平均 ,而 100 个 学 生 的 平均 成 绩 反而 与 这 个 总 平均 
有 和 较 大 差距 . 

由 此 可 见 ,在 考虑 佑 计量 的 优 劣 时 ,必须 从 某 种 整体 性 能 去 衡 
量 它 , 而 不 能 看 它 在 个 别 样 本 之 下 的 表现 如 何 .这 里 所 谓 “ 整 体 性 
能 ,有 两 种 意义 :一 是 指 估计 量 的 某 种 特性 ,具有 这 种 特性 就 是 好 
的 ,否则 就 是 不 好 的 .如 下 文 要 讲 的 “无 偏 性 ", 即 属于 此 类 . 二 是 指 
某 种 具体 的 数量 性 指标 . 两 个 估计 量 ,指标 小 者 为 优 . 如 下 文 讲 到 
的 均 方 误差 , 即 属于 此 类 .应 当 注意 的 是 :这 种 比较 ,归根 到 底 ， 
也 还 是 相对 性 的 .具有 某 种 特性 的 估计 是 否 一 定 就 好 ? 这 在 一 定 
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时 度 上 要 看 问题 的 具体 情况 ,不 是 绝对 的 .下 文 在 讲述 无 偏 估计 出 
还 会 涉及 这 一 点 ,作为 比较 准则 的 数量 性 指标 ,也 可 以 有 很 多 种 . 
很 有 可 能 :在 甲 指标 之 下 01 优 于 02 ,而 在 乙 指标 下 则 反之 ， 

我 们 这 样 说 ,当然 不 是 认为 优良 性 准则 和 售 计 量 的 优 劣 比较 

毫 无 意义 .相反 ,这 些 很 有 意义 , 且 是 参数 估计 这 个 分 支 学 科研 究 
的 中 心 问题 . 我们 是 想 提醒 读者 ,不 要 把 这 些 准 则 绝对 化 了 .每 种 
准则 在 某 种 情况 下 都 有 其 局 限 性 . 


4.3.1 估计 量 的 无 偏 性 


设 某 统计 总 体 的 分 布 包 含 未 知 参数 91 ,…, 94 ,XX! ,… ,XX 是 

从 该 总 体 中 抽出 的 样本 ,要 估计 g(01,…, 瓜 ).g 为 一 已 知 明 数 . 

设 g(Xi,…;, 义 , ) 是 一 个 佑 计量. 如果 对 任何 可 能 的 (6; ,… ,9 ) 都 
有 

Eg ,0 [8(X1,., X,)] = g(01,.%,0) (3.1) 


则 称 是 g (91,…, 64) 的 一 个 无 偏 估计 量 .记号 Ee ,…,o 是 指 : 求 期 
望 值 时 ,是 在 各 样本 XX!,…,X, 的 分 布 中 的 参数 为 61 ,…, 9 时 去 
做 的 .比如 ,我 说 Xi,X; 是 取 自 正 态 总 体 N(9,1) 的 样本 ,让 计算 
和 Xi + X, 的 期 望 值 .这 要 看 参数 值 9 等 于 多 少 :9= 1 时 ,期 望 值 
为 2;90=2.5 时 ,期 望 值 为 5. 标 出 Eo, 就 明白 显示 是 在 哪个 9 值 
之 下 去 算 期 望 值 ,也 表示 9 值 可 以 流动 .这 在 定义 3.1 式 中 尤其 有 
意义 .因为 在 参数 估计 问题 中 ,我 们 并 不 知 参数 的 真 值 , 它 能 在 一 
定 范围 内 流动 .如 废品 率 p, 可 在 [0,1j] 内 流动 . 当 比 较 两 个 佑 计量 
时 ,需要 对 种 种 可 能 的 参数 值 去 比较 . 故 在 Fe …,。 这 个 记号 中 强 
调 指 出 (01,…,9) 以 及 其 可 以 流动 ,是 重要 的 .在 不 致 引 起 混淆 
时 ,我们 也 可 以 简写 为 E. 

估计 量 的 无 偏 性 有 两 个 含义 .第 一 个 含义 是 没有 系统 性 的 偏 
差 ,不 论 你 用 什么 样 的 估计 量 和 去 估计 & ,总 是 时 而 (对 某 些 样本 ) 
偏 低 , 时 而 (对 另 一 些 样 本 ) 偏 高 .无 偏 性 表示 ,把 这 些 正 负 偏差 在 
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概率 上 平均 起 来 ,其 值 为 0. 比如 用 一 把 秤 去 秤 东西 ,误差 来 源 有 
二 :一 是 秤 本 身 结构 制作 上 的 问题 ,使 它 在 秤 东西 时 ,倾向 于 给 出 
偏 高 或 偏 低 之 值 ,这 属于 系统 误差 . 男 一 种 是 操作 上 和 其 他 随机 性 
原因 ,使 秤 出 的 结果 有 误差 ,这 属于 随机 误差 . 在 此 ,无 偏 性 的 要 求 
相应 于 秤 没有 系统 误差 ,但 随机 误差 总 是 存在 . 因此 ,无 偏 估 计 不 
等 于 在 任何 时 候 都 给 出 正确 无 误 的 估计 . 

为 一 个 含义 是 由 定义 (3.1) 结 合 大 数 定理 ( 见 第 三 章 定 理 
4.1) 引 伸 出 来 的 .设想 每 天 把 这 个 估计 量 交 (Xi1,…,X, ) 用 一 次 ， 
第 i 天 的 样本 记 为 8 (X1,…, 久 外 ) ,i 二 1,2,…,N,…. 则 按 大 数 


定理 , 当 N co 时, 各 次 估计 值 的 平均 , 即 》) (Xf,… 


X% )/AN, 依 概率 收 化 到 被 估计 的 值 g(91,…, 6,). 所 以 ,车 估计 
量 有 无 偏 性 , 则 在 大 量 次 数 使 用 取 平 均 时 ,能 以 接近 于 100% 的 把 
握 无 限 允 近 被 估计 的 量 .如 果 没 有 无 偏 性 , 则 无 论 使 用 多 少 次 ,其 
平均 也 会 与 真 值 保持 一 定 距离 一 一 这 距离 就 是 系统 误差 . 

由 此 可 见 , 估 计量 的 无 偏 性 是 一 种 优良 的 性 质 .但 是 ,在 一 个 
具体 的 问题 中 ,无 偏 性 的 实际 价值 如 何 , 还 必须 结合 这 问题 的 具体 


情况 去 考察 .如 在 秤 东西 那个 例 中 , 若 你 经 常 去 这 家 商店 买 东西 而 


该 店 用 的 秤 是 无 系统 误差 的 .这 等 于 说 , 店 里 在 种 上 显示 的 重量 ， 
是 你 所 买 的 东西 的 真实 重量 的 无 偏 估计 , 则 尽管 在 具体 某 一 次 购 
天 中 店 里 可 能 少 给 或 多 给 了 你 一 些 , 从 长 期 平均 看 ,无 偏 性 保证 了 
双方 都 不 吃亏 .在 此 ,无 偏 性 有 很 现实 的 意义 . 

现在 设想 男 一 种 情况 :工厂 每 周 进 原料 一 批 . 在 投入 使 用 前 ， 
由 实验 室 对 原料 中 某 些 成 分 含量 的 百分率 户 作 一 估计 ,根据 估计 
值 $ 采 取 相 应 的 工艺 调整 措施 . 无论 $p 比 真正 的 p 偏 高 或 偏 低 ,都 
会 有 损 于 产品 质量 .在 此 ,即使 是 p 的 无 偏 估 计 , 在 长 期 使 用 中 ， 
估计 的 正 负 偏 差 的 效应 并 不 能 抵消 .这 样 $ 的 无 偏 性 就 不 见得 很 
有 实用 意义 了 . 

例 3.1 设 X!,…,X 是 从 某 总 体 中 抽出 的 样本 , 则 样本 均 
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值 X 是 总 体 分 布 均值 9 的 无 偏 估计 . 
这 是 因为 , 按 定义 ,每 个 样本 X, 的 分 布 ,与 总 体 分 布 一 样 , 因 
此 其 均值 EE(X;) 就 是 0 ,而 
E(X)= > ECX ) /mn = nO/n = 0 


据 此 可 知 :在 正 态 总 体 N(y,o?) 中 用 多 估计 ,在 指数 分 布 总 体 中 
用 XX 估计 1AA ,在 二 项 分 布 总 体 中 用 XLN 估计 p, 以 及 在 波 哇 松 分 
布 总 体 中 用 义 估 计 等 ,都 是 无 偏 估计 . 

例 3.2 由 (1.1) 式 定义 的 样本 方差 S?, 是 总 体 分 布 方差 2 
的 无 偏 估计 . 

为 证 明 这 一 点 ,以 a 记 总 体 分 布 均 值 : EE(X,)=4. 也 有 
FE(X)=a, 把 X--X 写 为 (X -aa)-(X-a), 有 

2 (X: ~- XY = > [Xa)-(X-a)y 


i=1 


一 PDX; a 2K- a) NX, — a)+t n(X-a) 
注意 到 > (X - a) = n( 久 -a), 有 


DX X= y(X a nF- a 
= i=1 
因 a=E(X,)=E(), 有 
E(X;— a)’ = Var(X,) = oc,i = 1,.…,n 
E(X~-a)= Var(X) = SY Var(X,)/n? = ng/n? = go/n 
1 二 1 
于 是 得 到 
E(S’) = 2E (DR))= ou- ‘Pn) = 0 
这 就 说 明了 S? 是 o? 的 无 偏 估计 . 
这 就 解释 了 为 什么 要 在 样本 二 阶 中 心 短 m2 = > (Xi; - 
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X)2Az 的 基础 上 , 把 分 母 n 修正 为 n 一 1 以 得 到 S*. 这 与 以 前 讲 


过 的 一 点 也 相合 :在 第 二 章 的 附录 B 中 我 们 兽 讲 到 > (Xi - XY 


的 自由 度 为 n -1. 这 正好 是 正确 的 除数 ， 这 件 事 不 是 一 个 巧合 ， 

在 这 里 我 们 还 可 以 对 “日 由 度 " 这 个 概念 赋予 男 一 种 解释 :一 
共有 7 个 样本 ,有 ?2 个 自由 度 .用 S* 估计 方差 o* ,自由 度 本 应 为 
n. 但 总 体 均 值 a 也 未 知 ,用 XX 去 估计 之 ,用 掉 了 一 个 自由 度 , 故 只 
剩 下 -1 个 目 由 度 . 


如 果 总 体 均值 a 已 知 , 则 不 用 S? 而 用 > (Xi - a)?/n 去 个 


计 总 体 方差 o*( 在 a 未 知 时 不 能 用 ). 这 是 o? 的 无 偏 估计 ,分 母 为 
n 不 用 改 为 n 一 1. 因 为 此 处 n 个 自由 度 全 保留 下 了 (a 已 知 ,不 用 
估计 ,没有 用 去 自由 度 ). 

例 3.3 由 上 例 易 推 知 :用 S 去 估计 总 体 分 布 的 标准 差 o( 方 
差 o* 的 正平 方 根 ) ,不 是 无 偏 估计 .事实 上 , 据 第 三 章 (2.2) 式 及 上 
例 的 结果 ,有 

5“ = 开 (S) = Var(S) + (ESY) 

由 于 方差 总 非 负 :Var(S) 之 0, 有 cz 下 (S). 因 而 ES 即 如 
用 S 去 估计 c ,总 是 系统 地 偏 低 . 在 一 些 情 况 下 ,可 以 通过 简单 的 
调整 达到 无 偏 伯 计 . 办 法 是 把 S 乘 上 一 个 大 于 1 的 .与 样本 大 小 
n 有 关 的 因子 c, ,得 c,S. 适 当选 择 c, 可 以 使 E(c,S)= cE(S)= 
5. 对 正 态 分 布 总 体 N (4,o’) 而 言 ,不 难 证 明 ( 习 题 21) 


“yi (3) (3.2) 

由 上 (S)o 看 出 :在 例 2.3 中 给 出 的 均匀 分 布 R(91,0,) 中 01， 

9 的 估计 量 (2.2), 即 使 把 mm 改 成 S$ ,也 是 有 偏 的 (0; 偏 高 , 6， 

偏 低 ). 可 以 证 明 ( 习 题 22) :能 找到 常数 c, ,使 KcS 和 + ec,S 
分 别 是 01 ,0 的 无 偏 估计 ,但 c, 的 具体 数值 不 易 定 出 来 . 

例 3.4 我 们 已 经 知道 : 矩 估计 不 必 是 无 偏 的 , 极 大 似 然 估 计 

也 如 此 .事实 上 ,在 例 2.7 中 ,我 们 已 求 出 : 正 态 总 体 N (jy,o?) 的 
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方差 e 的 极 大 似 然 估 计 ,就 是 样本 二 阶 中 心 矩 mm, ,而 我 们 已 知 后 
者 不 是 无 偏 的 .再 看 一 个 例子 : 例 2.9 中 我 们 找 出 均匀 分 布 R(0， 
9) 中 8 的 极 大 似 然 估计 是 9”= max(XX! ,…,X; ) .不 用 计算 即 知 
9* 偏 低 .因为 ,每 个 样本 X; 都 在 (0,9) 内 , 故 其 最 大 值 , 即 9” ,也 
在 这 个 区 间 内 .下 面 通过 计算 Eo(9” ) 证 明 这 一 点 ,并 找 出 调整 因 
子 c; ;此 例 对 下 面 还 有 用 . 
先 算 9* 的 分 布 阻 数 G(x ,0). 因 为 0<6*<9, 有 

G(r,0) =0, 当 zz 委 0;G(rz,9) = 1, 当 x 守 0 
在 0<xz<0, 则 为 了 事件 10" 三 xz| 发 生 , 必 须 {XI 志 x1 ,…, {X, 碾 
x1 这 个 事件 同时 发 生 . 由 于 各 样本 独立 , 且 都 有 均匀 分 布 R(0， 
0), 有 PLX 和 zl)=>/0 ,因而 

G(r,0) 一 (rzLO)z 

对 z 求 导数 ,得 到 09* 的 概率 密度 函数 为 

gz0) = xz 如, 当 0<r<0; 此 外 为 0 (3.3) 
由 此 得 到 


x 0 0 n 72 
Es(0*)= | zg(z,0)de = 中 = dzv 久 = 4 (3.4) 
看 出 以 9 估计 9 系统 偏 低 , 且 90* 为 9 的 无 偏 估计 . 


4.3.2 最 小 方差 无 偏 估 计 


一 个 参数 往往 有 不 止 一 个 无 偏 估计 ,从 这 些 众多 的 无 偏 估 计 
中 ,我 们 想 挑 出 那个 最 优 的 .这 牵涉 到 两 个 问题 :一 是 为 优良 性 制 
定 一 个 准则 ,二 是 在 已 定 的 准则 之 下 ,如何 去 找到 最 优 者 . 这 涉及 
较 深 的 理论 问题 ,许多 内 容 都 超出 本 课程 范围 之 外 ,这 里 我 们 只 能 
作 一 个 很 初步 的 介绍 . 

1. 均 方 误差 , 设 外!,…,X, 是 从 某 一 带 参 数 9 的 总 体 中 抽出 
的 样本 ,要 估计 0. 若 我 们 采用 估计 量 6 = 6 (Xi,…,X, ), 则 其 误 
差 为 6(Xi XXX) 60. 这 误差 随 样 本 XI 9 人 的 具体 值 而 定 ， 
也 十 随机 的 ,因而 其 本 身 无 法 取 为 优良 性 指标 .我 们 把 它 平方 以 消 
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除 符号 ,得 (6(XX!,…, XX, ) -0) ,然后 取 它 的 均值 , 即 取 
M3 (0) 一 Eo[ 0 (CX1,*, X,) 和 9) (3.5) 
作为 6 的 误差 大 小 从 整体 角度 的 一 个 衡量 . 这 个 量 愈 小 ,就 表示 6 
的 误差 平均 讲 比 较 小 ,因而 也 就 愈 优 . M3 00) 就 称 为 估计 量 6 的 
“ 均 方 误差 ”( 误 差 平方 的 平均 ). 不 言 而 喻 , 均 方 误差 小 并 不 能 保证 
9 在 每 次 使 用 时 一 定 给 出 小 的 误差 . 它 有 时 也 可 以 有 较 大 的 误差 ， 
但 这 种 情况 出 现 的 机 会 较 少 . 
用 均 方 误 差 的 观点 就 容易 回答 前 面 提 到 过 的 一 个 问题 :用 
100 个 学 生 的 平均 成 绩 作 为 全 校 学 生平 均 成 绩 的 估计 , 比 用 抽出 
的 第 一 个 学 生 的 成 绩 去 估计 好 .事实 上 ,这 两 个 估计 分 别 是 X = 
(Xi+… 十 Xi00)A100 和 Xi. 总体 分 布 为 正 态 N(A,o2).X 和 XI 
的 均 方 误差 分 别 为 
E(X—- pp) = o/00,E(X1 一 Ap)2 = 0 
故 Xi 的 均 方 误差 是 关 的 100 倍 . 
均 方 误差 并 不 是 唯一 可 供 选 择 的 准则 .例如 ,平均 绝对 误差 
Es 19(X1,…,X,) 一 9| ,以 及 其 他 许多 别 的 准则 ,看 来 都 很 合理 且 
在 某 些 场合 下 还 确 有 其 优点 ,但 是 ,由 于 平方 这 个 函数 在 数学 上 最 
易 处 理 , 使 这 个 准则 成 为 一 切 准则 中 应 用 和 研究 得 最 多 的 . 
按 第 三 章 (2.2) 式 ,有 z 
Mg (0) = Varg(6) + [Es(0)— 0 (3.6) 
即 均 方 误 差 由 两 部 分 构成 :一 部 分 是 Varo(6), 即 6 的 方差 ,表示 6 
自身 变异 的 程度 , 另 一 部 分 中 ,Eo(9) 一 9 表示 6 这 个 估计 量 的 系 
统 偏 差 . 如果 6 为 9 的 无 偏 估计 , 则 第 二 项 为 0, 而 这 时 有 
Ms (0) = Vars(0) (3.7) 
2. 最 小 方差 无 偏 估计 .从 前 面 的 讨论 看 到 ; 若 局 限于 无 偏 估 
计 的 范围 , 且 采 用 均 方 误差 的 准则 , 则 两 个 无 偏 估计 65; 和 6, 的 比 
较 ,归结 为 其 方差 的 比较 ;方差 小 者 为 优 . 
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例 3.5 设 Xi,…,X, 是 从 均匀 分 布 总 体 R(0,0) 中 抽出 的 
样本 .在 例 3.4 中 已 指出 过 9 的 两 个 无 偏 估 计 : 0) =2 XX,6,= 
2 二 max(Xi，…,Xn). 有 (参看 第 三 章 , 例 2， 5) 


和 — 0 
Vare(01) = 4Vare(X) = Vare(X1) = = 一 4 Tg- = 3 


为 计算 90, 的 方差 , 仍 以 0 记 max(X1,…,X, ). 按 9* 的 密度 函数 
(3.3), 得 


6 
Es(0*)= 10,Ee(0*?) = | zdzr /0 = 一 一 二 02 


7 十 了 
因此 
x #2 _ 关 2 nn oo2 
Varg(0  ) = Eo(0*°)— [Es(0°)|’ = CT 二 万 2 
而 
x、 1 +1Y 
Vars(0> ) = | 7 ) van( ) = 0 


当 nn>1 时 ,总 有 n(n+2)>>3n. 故 除非 n=1,6, 的 方差 总 比 6， 
的 方差 为 小 , 且 这 一 点 不 论 未 知 参 数 9 取 什 么 值 都 对 . 因此 ,在 
“方差 小 者 为 优 ” 这 个 准则 下 ,9, 优 于 6) , 当 交 =1 时 ,6 与 6 重 


人 
品 ， 


如 果 0 是 0 的 一 个 无 偏 估计 , 且 它 的 方差 对 9 的 任何 可 能 取 
的 值 ,都 比 任何 其 他 的 无 偏 估 计 的 方差 为 小 ,或 至 多 等 于 它 , 则 在 


方差 愈 小 愈 好 "这 个 准则 下 ,6 就 是 最 好 的 , 它 称 为 9 的 最 小 广 
差 无 偏 佑 计 ”, 简 记 为 MVU 估计 *. 


定义 3.1 设 6 为 g(0) 之 无 偏 估计 .车 对 g(6) 的 任何 一 个 无 
偏 估 计 9| 都 有 
Vare(0) < Vary(0)) 


* MVU 是 “最 小 方差 无 偏 ” 的 英语 Minimum Variance Unbiased 的 缩写 . 
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对 9 的 任何 可 能 取 的 值 都 成 立 , 则 称 6 为 g(9) 的 一 个 最 小 方差 无 
偏 估计 (MVU 估计 ). 

从 例 3.5 知 6, 的 方差 小 于 61 的 方差 .但 我 们 并 不 能 由 此 就 肯 
定 9, 就 是 9 的 MVU 估计 ,因为 也 可 能 还 存在 其 他 的 无 偏 估计 ， 
其 方差 比 9, 的 更 小 .那么 ,怎样 去 寻找 MVU 估计 呢 ? 在 数理 统 
计 学 中 给 出 了 一 些 方法 ,我 们 只 能 简略 地 介绍 其 中 的 一 个 . 这 个 方 
法 的 思想 如 下 : 先 研 究 一 下 ,在 g(9) 的 一 切 无 偏 估计 中 ,方差 最 小 
能 达到 多 少 呢 ”如果 我 们 求 出 了 这 样 一 个 方差 的 下 界 , 则 如 某 个 
估计 9 的 方差 达到 这 个 下 界 , 那 它 必定 就 是 MVU 估计 . 

3. 求 MVU 估计 的 一 种 方法 :克拉 美 - 劳 不 等 式 . 

我 们 只 考虑 单 参 数 的 情况 . 设 总 体 的 概率 密度 函数 或 概率 孙 
数 f(x,0) 只 包含 一 个 参数 , 义 !,…,X, 为 从 该 总 体 中 抽出 的 样 
本 ,要 估计 g(0). 记 


1(9) = Gad Je 0) |dz (3.8) 


co ,对 正 态 总 体 则 - oo< 工 < co. 如 果 总 体 分 布 是 离散 的 , 则 (3.8) 
改 为 


2 
1(9) = >) (Se) | flais0) (3.9) 
这 里 求 和 >, 遍及 总 体 的 全 部 可 能 值 a1,a,,…. 为 确定 计 ,我 们 下 
面 就 连续 型 的 情况 去 讨论 . 对 离散 型 的 情况 ,只 须 作 相应 的 修改 ， 
有 如 把 (3.8) 修 改 为 (3.9). 
克拉 美 - 劳 不 等 式 :在 一 定 的 条 件 下 ,对 g(0) 的 任 一 无 偏 估计 
&= 有 (XI X，) ,有 
Vars( 人 ) 之 (8 (0)) /A(nI(0)) (3.10) 
2 是 样本 大 小 . 


这 个 不 等 式 给 出 了 g (09) 的 无 偏 估计 的 方差 的 一 个 下 界 , 即 
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(3.10) 式 右边 . 如果 g (0) 的 某 个 无 偏 估计 其 方差 正好 达到 了 
(3.10) 右 端 , 则 它 就 是 g(0) 的 MVU 估计 ,这 不 等 式 的 成 立 有 一 
定 的 条 件 . 实 际 上 ,在 其 表述 中 ,就 包含 了 要 求 9f(x ,90)/909 和 


g〈6) 存 在 的 条 件 ,其 他 的 条 件 将 在 下 文 推 导 中 看 出 ， 
记 


S= S(X1,…, X,,0) = 2 ologf(X;,0)/90 
i=1 


_ > oC) Cx,0) 


因为 /(z,0) 为 密度 ,有 | f(z,0)dz = 1 .两 边 对 69 求 导 ,并 假定 


(这 就 是 条 件 之 一 ) 左 边 求 导 可 搬 到 积分 号 内 ,有 


因此 
El :0 f(x,0) ] 


_ | (2 9)]/(z,g)dz 
-Je 
于 是 ,由 X1,…,X, 的 独立 性 ,有 
Vare( S)= DVar (Fx.,0)) 


= DE 0 fpcxi,0)] 


| 


按 第 三 章 定 理 3.1 的 2°, 有 


(3.11) 


| [2 6.0)] f(x,0)dr = nl(0) 


| Cove (fg ,S) 1 < Varo(g)Vare( S) = nl(0)Varo($t) 


(3.12) 
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由 (3.11) 有 Es(S)=0. 按 第 三 章 (3.2) 式 ,有 
Cove(&， S)= Ee(BS) 


= ae fg) pz,0) 


-IT fC.,0) dz dz， 


由 乘积 的 导数 公式 可 知 
> [2 /rz,0)] Tr,0) 


_ 9f(z1,0)°… f(x , 0) 
090 


以 此 代入 上 式 , 并 假定 对 0 求 偏 导数 可 移 至 积分 号 外 面 (这 又 是 
一 个 条 件 1), 则 得 


Cove(B,S) = || Bz10s 70) fz1,0) f(zn, 0) didz 


但 上 式 右边 的 积分 就 是 Eel 名 ) ,因为 g(6) 的 无 偏 估计 ,这 积分 就 
是 g(4). 故 上 式 右 边 为 g (90), 因而 得 到 Cove( 名 ,S)=g 《9)， 以 
此 代入 (3.12), 即 得 (3.10). 

不 等 式 (3.10) 是 瑞典 统计 学 家 HH. 克拉 美和 印度 统计 学 家 C. 
R. 劳 在 1945 一 1946 年 各 自 独 立 得 出 的 , 故 文献 中 一 般 称 为 克拉 
美 一 劳 不 等 式 ; 这 个 不 等 式 在 数理 统计 学 中 有 多 方面 的 应 用 ,此 处 
求 MVU 估计 是 其 中 之 一 . 

顺便 提 一 下 :(3.10) 中 1(6) 这 个 量 的 表达 式 (3.8), 最 初 是 英 
国 统计 学 家 R.A. 费 吹 尔 在 20 年 代 提 出 的 ,后 人 称 之 为 “ 费 软 尔 
信息 量 `. 此 量 出 现在 (3.10) 中 ,并非 偶然 的 巧合 .从 (3.10) 我 们 可 
以 对 为 什么 把 1(9) 称 为 “信息 量 ” 获 得 一 点 直观 的 理解 :1(60) 愈 
大 ,(3.10) 式 中 的 下 界 愈 低 , 表 示 g(49) 的 无 全 估计 更 有 可 能 达到 
较 小 的 方差 一 一 即 更 有 可 能 被 估计 得 更 准确 一 些 . g(9) 是 通过 样 
本 去 估计 的 ,g(9) 能 估 得 更 准 , 表 示 样 本 所 含 的 信息 量 愈 大 .一 
有 ?2 个 样本 ,如 把 总 信息 量 说 成 是 (3.10) 右 边 的 分 母 n1(9), 则 
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一 个 样本 正好 占有 信息 量 1(9),1(9) 这 个 量 在 数理 统计 学 中 很 重 
要 ,有 多 方面 的 应 用 ,但 大 多 超出 本 课程 的 范围 . 

不 等 式 (3.10) 并 不 直接 给 出 找 MVU 估计 的 方法 . 它 的 使 用 
方式 是 : 先 要 由 直观 或 其 他 途径 找 出 一 个 可 能 是 最 好 的 无 偏 估计 ， 
然后 计算 其 方差 ,看 是 否 达到 了 (3.10) 式 右 端 的 界限 , 行 达 到 了 ， 
就 是 MVU 估计 .同时 ,还 得 仔细 验证 不 等 式 推导 过 程 中 所 有 的 条 
件 是 否 全 满足 ,这 有 时 是 不 大 容易 的 ,在 以 下 诸 例 中 ,我 们 都 略 去 
了 这 步 验证 . 

例 3.6 设 XX!,…,X, 为 抽 自 正 态 总 体 N(9,o ) 的 样本 ,o” 
已 知 (因而 只 有 一 个 参数 9) ,要 估计 9. 本 例 


f(x,0) = (V2xe ) iexp| - 5(z 一 9)? | 
因而 
1(0)= (Vax0) | B(x - 0)exp[- 直 (x -0)] dz 


6 的 一 个 无 偏 估 计 , 方 差 正好 是 o [xm , 故 X 就 是 6 的 MVU 估计 . 
虽然 我 们 是 在 c 已 知 的 条 件 下 证 得 X 为 9 的 MVU 估计 ,但 

不 难 推 知 ,这 个 结论 当 co 未 知 时 也 对 .证 明 留 给 读者 (习题 23). 
例 3.7 指数 分 布 的 费 软 尔 信息 量 1(4 ) 为 


co 2 
I(A) = | (7 Ae “dr = A 


放 符 要 由 大 小 为 n 的 样本 去 估计 总 体 均 值 g (A)= 1A4, 则 按 
(3.10),1A4 的 无 偏 估 计 的 方差 不 能 小 于 
[g (A)E/nT()) = 1/(1°) 
而 样本 均值 X 是 174 的 一 无 偏 估 计 , 方 差 正好 为 1/(nX*). 故 XX 是 
1A4 的 MVU 估计 . 
例 3.8 回 到 例 3.6. 若 均值 6 已 知 而 要 估计 方差 , 则 不 难 证 
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明 ; 31(X,- 9)2/n 是 o2 的 MVU 估计 ,计算 留 给 读者 (在 计算 费 
i=1 


琴 尔 信息 量 时 ,注意 要 把 .o* 作为 一 个 整体 看 .可 以 引进 新 参数 
A = 0 再 计算 ) . 

如 果 0,c 都 未 知 而 要 估计 co , 则 可 以 证 明 : 样 本 方差 S? 为 
o” 的 MVU 估计 ,但 这 个 证 明 已 超出 本 方法 的 范围 之 外 . 

例 3.9 为 估计 均匀 分 布 R(0,09) 中 的 参数 6, 在 例 3.5 中 引 


进 过 两 个 无 偏 估计 5 = 2 广 和 5: = 于 二 omnax( X1，,…,X,) ,并 证 明 


了 90, 优 于 0 .事实 上 可 以 证 明 :6， 就 是 9 的 MVU. 但 这 个 结论 不 
能 利用 不 等 式 (3.10) 去 证 明 . 这 是 因为 总 体 的 密度 函数 并 非 9 的 
连续 函数 . 它 有 一 个 间断 点 :0= x (注意 :是 把 A(z,9) 中 的 二 国 
定 ,作为 0 的 函数 时 的 间断 点 ), 故 导数 9 f(x,0)/39 非 处 处 存在 . 
证 明 9, 为 6 的 MVU 估计 要 用 另外 的 方法 ,此 处 不 能 讲 了 . 

下 面 举 一 个 离散 型 总 体 的 例子 . 

例 3.10 总 体 分 布 为 二 项 分 布 B(N,z) ,概率 函数 为 


N 
fxsp) = (pO pv, = 0 N 


由 此 算出 费 软 尔 信息 量 ( 按 (3.9) 式 ) 
ID = ga Noy ja-avr 
右边 这 个 和 不 是 别 的 , 正 是 总 体 方差 , 故 这 个 和 等 于 Np(1-p) 
(第 二 章 例 2.2). 因此 
1(p)= Np (1 — p)"! 

按 (3.10),p 的 无 偏 估计 (基于 大 小 为 x 的 样本 ) 的 方差 ,不 能 小 
于 p(1 一 p)A(nN). 现 XAN 为 p 之 一 无 偏 估计 ,其 方差 为 

(X 的 方差 )AN?= 总 体 方差 /A(nN?) = Np(1 -pp)/(nN》? 

= p(1 — p)/AnN) 
因此 ,XAN 就 是 p 的 MVU 估计 . 
特别 当 N=1 时 ,得 出 :“ 用 频率 估计 概率 ”, 是 MVU 估计 .在 
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例 2.13 中 ,我 们 曾 求 出 p 的 贝 叶 斯 估计 (2.14), 并 指出 过 它 与 频 
率 这 个 估计 比 ,可 能 有 某 些 优点 .这 就 看 出 :“ 最 小 方差 无 偏 ” 这 个 
准则 也 不 是 绝对 的 . 

例 3.11 仿 例 3.10 可 以 证 明 : 在 波 哇 松 分 布 P(X) 的 总 体 中 
估计 ,X 是 MVU 估计 .证 明 留 给 读者 . 


4.3.3 估计 量 的 相合 性 与 渐 近 正 态 性 


1 相合 性 . 在 第 三 章 中 我 们 曾 证 明 大 数 定理 . 这 个 定理 说 :着 
及 1，X >， ”3 入，， 机 独立 同 分 布 ， 其 公共 均值 为 9. 记 入) 一 


> X;/n , 则 对 任 给 s>0, 有 
:~-1 


limP(|X, -0|>e)=0 (3.13) 

(在 证 明 这 个 定理 时 假定 了 X; 的 方差 存在 有 限 .但 我 们 曾 指 出 : 
方差 存在 的 条 件 并 非 必 要 ). 

现在 我 们 可 以 从 估计 的 观点 对 (3.13) 作 一 个 解释 . 我们 把 
X1, 义 ;,"… ,XX 看 作 是 从 某 一 总 体 中 抽出 的 样本 .抽样 的 目的 是 估 
计 该 总 体 的 均值 0. 概率 P(|X, -9| 实 e) 是 :“ 当 样本 大 小 为 n 
时 ,样本 均值 X, 这 个 估计 与 真 值 b 的 偏离 达到 es 这 么 大 或 更 大 ” 
的 可 能 性 .(3.13) 表 明 : 随 着 ”的 增加 ,这 种 可 能 性 愈 来 愈 小 以 至 
趋 于 0. 这 就 是 说 ,只 要 样本 大 小 n 足够 大 ,用 样本 均值 去 估计 总 
体 均 值 ,其 误差 可 以 任意 小 .在 数理 统计 学 上 ,就 把 X, 称 为 是 9 的 
“相合 估计 .字面 的 意思 是 : 随 着 样本 大 小 的 增加 ,被 估计 的 量 与 
估计 量 逐 渐 “ 合 "在 一 起 了 . 

相合 性 的 一 般 定义 就 是 这 个 例子 的 引伸 : 

定义 3.2 设 总 体 分 布依 赖 于 参数 6 ,… ,4 ,g(6 ,不 ) 是 
901,…,04 之 一 给 定子 数 . 设 XXX ，…,X 为 自 该 总 体 中 抽出 的 
样本 ,本 (Xi1,…,X;) 是 500 … 久 ) 的 一 个 估计 量 .如 果 对 任 给 
es >0 有 

lim Po 2 |T(X1,%, Xn) - g(01,°%°,0)| 宇 6)=0 


(3.14) 
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而 且 这 对 (0 ,…，,6,) 一 切 可 能 取 的 值 都 成 立 , 则 称 TCX1,…, XX, ) 
是 g(91,…,) 的 一 个 相合 信 计 . 

记号 Pe …,e 的 意义 ,表示 概率 是 在 参数 值 为 (01 ，,… ,0 ) 时 去 
计算 的 (参看 前 面 关于 记号 Eo ,…,o 的 说 明 ). 在 讲述 大 数 定理 时 
我 们 曾 引 进 过 “ 依 概率 收敛 ”的 术语 .使 用 这 个 术语 ,相合 性 可 简单 
地 描述 为 ;如果 当 样本 大 小 无 限 增加 时 ,估计 量 依 概率 收敛 于 被 佑 
计 的 值 , 则 称 该 估计 量 是 相合 佑 计 . 

相合 性 是 对 一 个 估计 量 的 最 基本 的 要 求 . 如 果 一 个 佑 计量 没 
有 相合 性 ,那么 ,无论 样本 大 小 多 大 ,我 们 也 不 可 能 把 未 知 参 数 售 
计 到 任意 预定 的 精度 .这 种 估计 量 显 然 是 不 可 取 的 . 

如 同样 本 均值 的 相合 性 那样 ,常见 的 矩 估 计量 的 相合 性 ,都 可 
以 基于 大 数 定 理 得 到 证 明 . 我 们 再 以 用 二 阶 中 心 矩 区 >(n) 


= > (X 一 总)2]z 为 例 . 以 a 和 2 分 别 记 总 体 的 均值 和 方差 
注意 到 


n 


DX ap= DX -E+ (KX, -a)] 


i=1 


= OX; KX,) +n(X,— a) 
f 二 于 . 


m2(n) = 二 > (X — a)*— (X, 一 CD) 


依 大 数 定理 ，》) (X; - a)?/n 依 概 率 收复 于 巨 (X - a)2 = 7, 而 


X, 一 a 依 概率 收 钱 于 0. 故 m3(n) 依 概率 收敛 于 2, 即 它 是 总 体 
方差 a“ 的 相合 估计 .因为 样本 方差 与 样本 二 阶 中 心 矩 只 相差 一 个 
因子 nA(n 一 1), 而 当 2 一 oo 时 这 个 因子 趋 于 1, 知 样本 方差 也 是 
总 体 方差 的 相合 估计 .这 样 可 以 证 明 : 前 面 例子 中 的 许多 估计 都 有 
相合 性 . 
极 大 似 然 估 计 在 很 一 般 的 条 件 下 也 有 相合 性 . 其 证 明 比 较 复 
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森 ,不 能 在 此 讨论 了 . 

2. 渐 近 正 态 性 .估计 量 是 样本 Xi,……，,X, 的 图 数 , 其 确切 分 
布 要 用 第 二 章 2.4 节 的 方法 去 求 .除了 若干 简单 的 情况 以 外 ,这 常 
是 难于 实现 的 .例如 ,样本 均值 可 算是 最 简单 的 统计 量 , 它 的 分 布 
也 不 易 求 得 . 

可 是 ,正如 在 中 心 极 限定 理 中 所 显示 的 , 当 7 很 大 时 ,和 的 分 
布 渐 近 于 正 态 分 布 .理论 上 可 以 证 明 ,这 不 只 是 和 所 独 有 的 ,许多 
形状 复杂 的 统计 量 , 当 样本 大 小 xw-~>ce 时 ,其 分 布 都 渐 近 于 正 态 分 
布 .这 称 为 统计 量 的 “ 浙 近 正 态 性 ”. 至 于 哪些 统计 量具 有 渐 近 正 态 
性 ,其 确切 形式 如 何 , 这 都 是 很 深 的 理论 问题 ,在 我 们 这 个 课程 的 
范围 内 无 法 细 加 介绍 了 . 

估计 量 的 相合 性 和 崭 近 正 态 性 称 为 佑 计量 的 大 样本 性 质 . 指 
的 是 :这 种 性 质 都 是 对 样本 大 小 2 一 co 来 谈 的 .对 一 个 固定 的 ，， 
相合 性 和 渐 近 正 态 性 都 无 意义 .与 此 相对 ,估计 量 的 无 偏 性 概念 是 
对 固定 的 样本 大 小 来 谈 的 ,不 需要 样本 大 小 趋 于 无 穷 .这 种 性 质 称 
为 ”小 样本 性 质 .因此 ,大 小 样本 性 质 之 分 不 在 于 样本 的 具体 大 小 
如 何 ,而 在 于 样本 大 小 趋 于 无 穷 与 否 . 


4.4 区 间 人 估计 
4.4.1 基本 概念 


如 前 所 述 ,点 估计 是 用 一 个 点 ( 即 一 个 数 ) 去 估计 未 知 参 数 . 顾 
名 思 义 ,区间 估 计 就 是 用 一 个 区 间 去 估计 未 知 参数 , 即 把 未 知 参 数 
值 估 计 在 某 两 界限 之 间 . 例 如 ,估计 一 个 人 的 年 龄 在 30 到 35 岁 之 
间 ; 估 计 所 需 费 用 在 1000 一 1200 元 之 间 等 等 .区 间 估 计 是 一 种 很 
前 用 的 估计 形式 ,其 好 处 是 把 可 能 的 误差 用 醒目 的 形式 标 出 来 了 . 
你 估计 费用 需 1000 元 ,我 相信 多 少 会 有 误差 .误差 多 少 ? 单 从 你 
提出 的 1000 这 个 数字 还 给 不 出 什么 信息 ,你 若 估计 费用 在 800 一 
1200 元 之 间 , 则 大 们 会 相信 你 在 作出 这 估计 时 ,已 把 可 能 出 现 的 
误差 考虑 到 了 ,多 少 给 人 们 以 更 大 的 信任 感 . 
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现今 最 流行 的 一 种 区 间 估 计 理 论 是 原籍 波兰 的 美国 统计 学 家 
J]. 奈 曼 在 本 世纪 30 年 代 建 立 起 来 的 .他 的 理论 的 基本 概念 很 简 
单 .为 书写 简单 计 ,我 们 暂 设 总 体 分 布 只 包含 一 个 未 知 参 数 0, 且 
要 估计 的 就 是 9 本 身 , 如果 总 体 分布 包 含 若干 个 未 知 参 数 0 ,…， 
0; ,而 要 估计 的 是 g(01,…, 奴 ), 基 本 概念 并 无 不 同 .这 将 在 后 面 
的 例子 中 看 到 . 

设 Xi ,…,XX, 是 从 该 总 体 中 抽出 的 样本 .所 谓 9 的 区 间 估 计 ， 
就 是 满足 条 件 61 (Xj,…,X,) 志 0,(X|,…， XX, ) 的 两 个 统计 量 0,， 
6; 为 端点 的 区 间 [61,6,]. 一 旦 有 了 样本 Xl,…,X, ,就 把 9 估计 


在 区 间 [ 01(X1,…,X,),02(X1,…,X,) | 之 内 ,不 难 理解 ,这 里 有 
两 个 要 求 : 
1. 9 要 以 很 大 的 可 能 性 落 在 区 间 [61,60,] 内 ,也 就 是 说 ,概率 
Po(O01(X1,%, X,) S00 (X,,…,X,)) (4.1) 
要 尺 可 能 大 . 
2. 估计 的 精密 度 要 尽 可 能 高 . 比方 说 ,要 求 区 间 的 长 度 6, 一 
091 尽 可 能 小 ,或 某 种 能 体现 这 个 要 求 的 其 他 准则 . 
例如 , 估 一 个 人 的 年 龄 在 某 一 区 间 内 ,例如 [30,35j] 内 .我 们 要 
求 这 估计 尽量 可 靠 , 即 该 人 的 年 龄 有 很 大 把 握 确 在 这 区 间 内 , 同 
时 ,也 要 求 区 间 不 能 太 长 : 比如 ,估计 一 人 的 年 龄 在 10 一 -90 岁 之 
间 ,当然 可 靠 了 ,但 精度 太 差 ,用 处 不 大 . 
但 这 两 个 要 求 是 相互 矛盾 的 .区 间 估 计 理 论 和 方法 的 基本 问 
题 ,莫不 在 于 在 已 有 的 样本 资源 的 限制 下 ,怎样 找 出 更 好 的 估计 方 
法 ,以 尽量 提高 此 二 者 一 一 可 靠 性 和 精度 ,但 终归 有 一 定 的 限度 . 
奈 曼 所 提出 并 为 现今 所 广泛 接受 的 原则 是 : 先 保 证 可 靠 度 ,在 这 个 
前 提 下 尽量 使 精度 提高 .为 此 他 引进 了 如 下 的 定义 . 
定义 4.1 给 定 一 个 很 小 的 数 w >0. 如 果 对 参数 9 的 任何 
值 ,概率 (4.1) 都 等 于 1 一 a, 则 称 区 间 估 计 [9,,9,] 的 置信 系数 为 
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区 间 估 计 也 常 你 为 “置信 区 间 ” .字面 上 的 意思 是 :对 该 区 间 能 
包含 未 知 参数 9 可 置信 到 何 种 程度 . 

有 时 ,我 们 无 法 证 明 概 率 (4.1) 对 一 切 0 都 恰好 等 于 1 一 a, 但 
知道 它 不 会 小 于 1 一 a, 则 我 们 称 1 一 a 是 [61,0,] 的 “置信 水 平 ”. 
按 此 ,置信 水 平 不 是 一 个 唯一 的 数 . 因为 , 若 概 率 (4.1) 总 不 小 于 
0.8, 那 它 也 总 不 小 于 0.7,0.6,… 等 .就 是 说 , 若 8 为 置信 水 平 , 则 
小 于 B 的 数 也 是 置信 水 平 ,置信 系数 是 置信 水 平 中 的 最 大 者 .在 
实用 上 ,人 们 并 不 总 是 把 这 两 个 术语 严 加 区 别 , 这 要 看 各 人 的 习 
惯 ，. 

定义 4.1 中 的 a ,一般 以 取 为 0.05 的 最 多 ,还 有 0.01,0.10， 
以 至 0.001 等 ,也 视 情况 需要 而 使 用 .这 几 个 数字 本 身 并 无 特殊 意 
义 , 主 要 是 这 样 标准 化 了 以 后 对 造 表 方便 . 

区 间 估计 理论 的 主要 问题 , 按 奈 曼 的 上 述 原则 就 是 在 保证 给 
定 的 置信 系数 之 下 ,去 寻找 有 优良 精度 的 区 间 估 计 . 而 这 个 “ 优 
民 ,也 可 以 有 种 种 准则 .这 方面 现 已 有 了 一 些 结果 ,但 在 本 课程 范 
围 之 内 ,我们 无 法 去 涉及 这 些 较 深 的 理论 问题 ,我 们 所 能 做 的 ,就 
是 从 直观 出 发 如 何 去 构 造 看 来 是 合理 的 区 间 佑 计 . 这 就 是 下 面 两 
段 要 讨论 的 问题 . 


4.4.2 ” 枢 轴 变量 法 
从 一 个 简单 例子 人 手 . 设 Xl1,… ,入 , 为 抽 目 正 态 总 体 N(y， 
0 ) 的 样本 ,o? 已 知 ,要 求 上 的 区 间 估 计 . 


先 找 一 个 py 的 良好 的 点 估计 . 在 此 可 选择 样本 均值 头 . 由 总 
体 为 正 态 易 知 


Va(X- 1)/s ~ NC,1) (4.2) 
以 @ iCN(0,1) 的 分 布 函数 .对 0<B<1( 一 般 是 8 很 小 ) ,用 方程 
BD(us) =1-8 (4.3) 


定义 记号 ug. ug 称 为 分 布 N(0,1) 的 “上 8B 分 位 点 ”. 其 意义 是 : 
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N(0,1) 分 布 中 大 于 ws 的 那 部 分 的 概率 ,就 是 8. 图 4.2 中 画 出 的 


是 N(0,1) 的 密度 函数 p(z) = (V2 ) :ez 2 的 图 形 , 涂 黑 部 分 
标 出 的 面积 为 8. 
上 8 分 位 点 的 概念 可 推广 到 任 
何 分 布下 :满足 条 件 F(vg)=1 一 8B 的 
点 ve; 就 是 分 布 函 数 下 的 上 8B 分 位 
点 .在 数理 统计 学 的 应 用 中 , 除 正 态 
Do * 分布 外 ， 统 计 三 大 分 布 " 的 上 分 位 点 
很 常用 .以 后 ,我 们 分 别 用 zz(8)，t 
图 4.2 (8) 和 FF,,(B) 记 自由 度 2 的 卡 方 
分 布 ,自由 度 n 的 z 分 布 ,以 及 自由 
度 为 (n,m ) 的 下 分 布 的 上 B 分 位 点 ,这 些 都 有 表 可 查 . 
为 外 ,读者 还 须 注意 :在 有 的 著作 中 使 用 “下 分 位 点 ” ,分布 函 
数 下 的 下 B 分 位 点 是 指 满足 条 件 F(ws)=B 的 点 wwg. 上 、\ 下 分 位 
尽 之 间 的 换算 不 难 :分 布下 的 8 下 分 位 点 ,就 是 其 1-B 上 分 位 
点 . 当 分 布下 的 密度 函数 1 关于 原点 对 称 ( 即 f( 一 x)= f(x)) 时 ， 
的 上 、 下 B68 分 位 点 只 相差 一 个 符号 ,本 书 以 后 只 使 用 上 分 位 点 . 
现在 回 到 jy 的 区 间 估 计 问 题 .由 (4.2) 及 ws 的 定义 ,并 注意 
到 @B( 一 1)= 二 1 一 (1), 有 
Pl- wan(X- /oun)= Pun) — B(- un) 
= (1 -a/2)—-a/2=1-a 
此 式 可 改写 为 
P(X- ou,p/Vn CpuZK+our /Vn )= la 
此 式 指出 
[91,0,] = [Xoup/ Vns Xt oun/Vn | (4.4) 
可 作为 wx 的 区 间 估 计 , 置 信 系数 为 1 一 a. 
由 这 个 例子 悟 出 一 种 找 区 间 估 计 的 一 般 方法 ,可 总 结 为 以 下 
几 条 : 
1 找 一 个 与 要 估计 的 参数 g(6) 有 关 的 统计 量 人 ,一 般 是 其 
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p(X) 


-良好 的 点 估计 (此 例 工 为 X ); 
2 设法 找 出 工 和 g(9) 的 某 一 函数 SCT,g(CO)) ,其 分 布下 
要 与 9 无 关 ( 在 此 例 中 ,SCT,g(0)) 为 VC(X- AU)《Mo ,分 布下 就 
是 更).S 称 为 “ 枢 轴 变量 ”; 

3” 对 任何 常数 gc<<b ,不 等 式 4a 忒 S(T,g(0)) 志 4b 要 能 改写 
为 等 价 的 形式 A 三 g(0) 记 BB,A,B 只 与 ,a ,b 有 关 而 与 9 无 关 ; 

4” 取 分 布下 的 上 a 人 2 分 位 点 rw 和 上 (1=- a2) 分 位 点 
上 1 2 有 Fo)-FOoi oo)=1-a. 因 此 

Plw-ar S(T,g(0)) RR wr)=1-0a 
根据 第 3 条 ,不 等 式 Ww- 人 S(T,g(0)) 达 wjp 可 改写 为 A 过 
8(0) 硅 B 的 形式 ,A,B 与 荆 有 关 因 而 与 样本 有 关 .[A,B] 就 是 g 
(9) 的 一 个 置信 系数 1 一 a 的 区 间 估 计 . 

现在 举 一 些 例子 来 说 明 这 个 方法 ,这 些 例子 包含 了 许多 常用 
的 重要 区 间 估 计 . 

例 4.1 从 正 态 总 体 N(y,o?) 中 抽样 本 X1,…,X,,n 和 o? 
都 未 知 , 求 yx 的 区 间 估计. 

k 的 点 估计 仍 取 为 样本 均值 X. 作 为 枢 轴 变量 ,再 取 Vn( 一 
4)/o 已 不 行 .因为 虽然 这 变量 的 分 布 N(0,1) 与 参数 无 关 , 但 因 v 
未 知 , 条 件 3 已 不 满足 . 现 把 ec 改 为 样本 标准 差 S, 则 枢 轴 变量 一 
切 条 件 都 满足 了 ,因为 ( 见 第 二 章 (4.34)) 变 量 /n (久久)/S 服 
从 目 由 度 为 2 - 工 的 上 分 布 ,与 参数 无 关 . 由 此 出 发 用 4" ,并 注意 ; 
分 布 密度 关于 0 对 称 因而 ii-a2)= 一 总 -1(a2)，, 得 4 的 
区 间 估 计 

[XS iCaf2) /Vn K+ Se, (av (4.5) 
置信 系数 为 1- ca. 它 称 为 “一 样本 上 区 间 估 计 ”. 

例如 ,为 估计 一 物件 的 重量 y ,把 它 在 天 平 上 重复 秤 了 5 次 ， 
得 结果 为 (单位 为 克 ) 

5.52,5.48,5.64,5.51,5.43 
假定 此 天 平 无 系统 误差 且 随 机 误差 服从 正 态 分 布 . 则 总 体 分 布 为 
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No2z),Aw 即 未 知 的 重量 ,方差 c” 也 未 知 .算出 
X= (5.52 + :5.43)/5 = 5.516 


一 -一 一 一 一 一 一 一 一 一 
S= 5.52 — 5.516)?° + … + (5.43— 5.516)’] 


VvV 0.02412 = 0.078 


查 表 , 知 (0. 025) =2.776. 以 这 些 数值 代入 (4.5), 得 y 的 置信 
系数 0.95 的 区 间 估 计 为 [5.419,5.613]. 

[5.419,5.613] 是 一 个 具体 的 区 间 , yx 是 一 个 虽然 未 知 ， 但 其 
值 确 定 的 数 .[5.419,5.613j] 这 区 间或 者 包含 y, 或 者 不 包含 ,二 者 
只 居 其 一 .说 这 区 间 的 置信 系数 为 0.95, 其 确切 意义 应 当 是 : 它 是 
根据 所 有 的 数据 ,用 一 个 其 置信 系数 为 0.95 的 方法 作出 的 .可 见 
置信 系数 一 词 是 针对 方法 :用 这 方法 作出 的 区 间 估 计 , 平 均 100 次 
中 95 次 确 包 含 所 要 估计 的 值 .一 旦 算出 具体 区 间 ,就 不 能 再 说 它 
有 9S$% 的 机 会 包含 要 估计 的 值 了 . 这 一 点 意义 上 的 理解 必须 分 
清 , 正 如 说 一 个 人 长 于 挑 西 瓜 :他 挑 的 瓜 , 平 均 100 个 中 有 95 个 好 
的 . 某 天 他 给 你 挑 一 个 ,结果 或 好 或 坏 , 必 居 其 一 ,不 是 95% 的 好 . 
但 是 ,考虑 到 他 挑 瓜 的 技术 ,我 对 他 挑 的 比较 放心 ,这 就 是 置信 系 
数 . 

区 间 估 计 (4.5) 叫 做 一 样本 z 区 间 估 计 .“ 一 样本 "是 指 这 里 只 
有 一 个 总 体 ,因而 只 有 一 组 样本 ,以 别 于 下 例 . 

例 4.2 设 有 两 个 正 态 总 体 ,其 分 布 分 别 为 N(x1,o”) 和 
N(12,0”). 注意 方差 相同 . 设 wi,w23,o” 都 未 知 . 现 从 这 两 个 总 体 
分 别 抽出 样本 Xi,…,X, 和 六 | ,…,Y,. 要求 1 一 的 区 间 估 
计 . 

记 X 和 Y 分 别 为 X 和 YY; 的 样本 均值 ,而 

DX- XY + DY -7)]//aim -2 
据 第 二 章 (4. 36) 式 ， 知 


T = .(( 久 - Y)- (pa -12))/S~ tnt+m-2 
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的 分 布 不 依赖 于 参数 pi ,3,o”. 它 适合 于 作为 枢 轴 变量 的 条 件 ， 
按 4, 定 出 pi 一 jw 的 区 间 倍 计 为 
(X 一 Y) i Olyn4m-— 2(a 7/2) At nm 


nm 
(X— YY)+ Si,,, (0/2) | (4.6) 


置信 系数 为 1 一 a. 这 个 区 间 称 为 “两 样本 1 区 间 估 计 ”, 是 应 用 上 
常用 的 区 间 估 计 之 一 . 

如 考虑 上 例 , 设 有 另 一 物件 ,其 重量 pz 也 未 知 .在 这 园 一 架 
天 平 上 秤 4 次 ,得 结果 为 
5.45,5.40,5.34,5.51 
把 上 例 中 的 wp 记 为 1. 因 是 同一 架 天 平 ,方差 不 变 . 要 对 两 物件 重 
量 之 差 yl 一 2 作 区 间 估 计 . 可 用 (4.6). 算 出 

Y= (5.45+:… +5.51)/4 = 5.425 


DY,— Y):= (5.45 — 5.425)? + 1 + (5.51 -5.425)? 
j=] 


. = 0.01570 
结合 前 例 数 据 , 算 出 
X—-Y=-0.091,S = V0.02412 + 0.01570/vV 5+4—2 
= 0.075 
XV (ntn)/nm =V9/20 二 0.671. 取 a=0.05, 查 1 分 布 表 得 
17(0.025) =2.365. 把 这 些 都 代 人 (4.6) ,算出 1 - ji 的 区 疗 估 计 
为 一 0.210,0.028] ,置信 系数 0.95. 
在 实际 问题 中 ,两 总 体 方差 相等 的 假定 往往 只 是 近似 成 立 . 当 
方 守之 比 接近 1 时 ,用 (4.6) 产 生 的 误差 不 大 (这 里 的 “误差 ”一 词 
实际 的 置信 系数 与 名 义 的 置信 系数 1 一 a 有 出 入 ). 如 果 差 别 
较 大 ， 则 必须 假定 两 正 态 总 体 分 别 有 方 差 of 和 cj ,cz 和 a2 都 未 
知 .在 这 样 的 假定 下 求 pi 一 ys 的 区 间 估 计 问 题 ,是 数理 统计 学 上 
一 个 著名 的 问题 , 叫 贝 伦 斯 - 费 软 尔 问题 .因为 这 两 位 学 者 分 别 在 
1929 和 1930 年 研究 过 这 个 问题 ,他 们 以 及 后 来 的 研究 者 提出 过 
”193 ， 


- 些 解法 ,但 还 没有 一 个 被 公认 为 是 最 满意 的 . 
例 4.3 再 考虑 例 4.1, 但 现在 要 求 作 o“ 的 区 间 人 和 估计. 
据 第 二 音 (4.33), 有 (nn 一 1)S?/o? 一 X%-1. 于 是 (n 一 1)S2/o? 
适合 枢 轴 变量 的 条 件 . 按 4 ,得 o“ 的 区 间 估 计 为 
[ (x — 1)S2/X% 1(a/2),(n — 1)S?/Xi-1(1 — a/2)](4.7) 
置信 系数 为 1 - a. 类 似 地 , 若 另 有 一 正 态 总 体 N(y,o3) 及 从 中 抽 
出 的 样本 Yi1,…, Y;, ,要 作 方 差 比 of/o3 的 区 间 估 计 . 记 Sf 和 S3 
分 别 为 X1,…,X, 和 YY ,…,Y;, 的 样本 方差 , 按 第 二 章 (4.35), 有 
(S$/03) /A St/o4) ~ Fy 1,n1 
即 4.S5/S1 一 F,_1.n-1, 其 中 和 =of/o5. 于 是 得 到 枢 轴 变量 . 按 
4 ,得 出 比值 4 的 置信 系数 1 ~a 的 区 间 估 计 为 
[ CSI/SI) F171(1 ~ a/2), (SI/SI)F, 1.11(a /2)] 
(4.8) 
例 4.4 设 义 !,…,X, 为 抽 自 指数 分 布 总 体 的 样本 ,要 求 其 
参数 1 的 区 间 估 计 . 
在 第 二 章 2.4.3 小 节 中 曾 证 明 2nA 往 一 X3 . 故 2nX 可 作为 
枢 轴 变量 .由 4", 得 4 的 区 间 估 计 为 
[Xin(1 — a/2)/(2n X), XI(a /2)A2nX)] (4.9) 
置信 系数 为 1- a. 车 要 求 总 体 均 值 144 的 区 间 估 计 , 则 为 
[2n X/Xin(a/2),2n /Xia(l - oa/2)] (4.10) 
从 这 些 例子 可 以 看 出 “ 枢 轴 变量 法 ”这 和 名称 的 由 来 . 拿 本 例 来 
说 ,变量 2nA XX 起 了 一 个 “ 轴 心 ”的 作用 ,把 一 个 变量 ( 即 2nX XX) 介 
于 茶 两 个 界限 之 间 的 不 等 式 轻 轻 一 转 , 就 成 为 未 知 参数 4 介 于 革 
两 个 界限 之 间 的 不 等 式 . 
对 离散 型 变量 来 说 , 枢 轴 变量 法 不 易 使 用 .不 仅 由 于 满足 条 件 
1 一 4 的 枢 轴 变量 S(T,g (60)) 大 多 不 存在 ,即使 存在 了 ,由 于 其 
分 布下 为 离散 ,对 指定 的 8, 一 般 也 不 一 定 存 在 确切 的 上 8 分 位 
点 .对 离散 型 总 体 的 参数 去 找 具 有 所 指定 的 置信 系数 的 区 间 佑 计 
方法 ,超出 本 书 范围 之 外 .在 下 一 段 中 ,对 二 项 和 波 哇 松 分 布 参数 
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这 两 个 重要 情况 ,将 给 出 一 种 基于 极限 分 布 的 方法 . 

在 实用 中 ,除了 指定 的 置信 系数 外 ,往往 还 对 于 区 则 估计 的 长 
度 ,或 其 他 某 种 反映 其 精度 的 量 , 有 一 定 的 要 求 .在 有 些 情况 下 这 
个 问题 比较 好 处 理 .例如 ,N(w,c2) 当 2 已 知 时 ,we 的 区 间 估 计 
(4.4) 的 长 为 2auup n .为 要 使 这 个 长 度 不 超过 指定 的 工 >0, 只 
须 取 ?2 为 不 小 于 (2cu bp/L 的 最 小 整数 即 可 . 

对 例 4.3 正 态 分 布 方差 或 方差 比 的 估计 ,由 于 方差 本 身 的 意 
义 ,在 实际 问题 中 ,考虑 估计 和 值 与 它 相 差 多 少 售 ,往往 比 考 虑 估计 
值 与 其 差 的 绝对 值 更 好 .这 就 要 求 ,例如 ,区 间 (4.7) 的 右 端 不 超过 
左 缠 的 工 信 (L 1), 即 

Xi(a 2) /X21 - aa) 云 于 
在 给 定 了 上 之 后 ,可 以 查 X “分布 表 , 找 一 个 最 小 的 n 使 上 式 成 立 
即 可 .对 方差 比 的 情况 ,以 及 指数 分 布 参数 A( 或 14) 的 情况 ,也 
完全 类 似 地 处 理 . 

对 zz 区间 估计 , 则 情况 不 同 . 拿 一 样本 7 区 间 估 计 (4.5) 来 说 ， 
其 长 2St, 1(a 人 2)ANn 与 9 有关 ,而 S 与 样本 有 关 , 故 无 法 决定 这 
样 一 个 2 它 能 保证 在 任何 情况 下 都 有 2St, 1(a/2)ANn 声 L. 
1945 年 ,美国 统计 学 家 斯 泰 因 提 出 了 一 个 “两 阶段 抽样 ?的 方法 来 
解决 这 个 问题 : 先 抽出 样本 Xi,…,X，,, 算 出 样本 标准 差 S 如 前 . 
根据 S 的 大 小 决定 追加 抽样 的 数 日 :5S 愈 大 ,追加 抽样 次 数 愈 多 . 
具体 公式 如 下 : 先 引 进 记 号 [a] = 不 超过 a 的 最 大 整数 ,例如 
[3.12]=3,[2j=2 等 ,追加 抽样 次 数 mm 的 公式 为 

人 1 -之 [41% -1(a /2)S*/L? + 1 
la-1- [040a2)S2AL2], 其 他 情况 
记 原 有 样本 和 追加 样本 全 体 的 样本 均值 为 X, 则 可 以 证 明 , 长 为 上 
的 区 间 估 计 [ 久 一 工 用 ,多 + 荆 用 ] 有 置信 系数 1 一 


4.4.3 大 样本 法 


大 样本 法 就 是 利用 极限 分 布 ,主要 是 中 心 极限 定理 ,以 建立 枢 
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轴 变 量 , 它 近似 满足 枢 轴 变量 的 条 件 2 .最 好 通过 例子 来 说 明 . 
例 4.5 某 事 件 A 在 每 次 试验 中 发 生 的 概率 为 p. 作 nn 次 独 
立 试验 ,以 Y, 记 A 发 生 的 次 数 ,要 求 p 的 区 间 估 计 . 
设 nn 相当 大 , 则 按 定 理 4.3, 近 似 地 有 (Y, 一 np)/v np(l—p) 
一 N(0,1). 于 是 (Y, 一 np)/v np(1 一 p)~N(0,1) 可 取 为 枢 轴 变 
量 .由 
P(- up (Ynp)/V nap- pS ua) a 
(4.11) 
可 改写 为 
P(A 雪 二 B)> 1-na (4.12) 
其 中 A ,B 是 二 次 方程 
(YY — np) /np(l — p)) = wu 
的 两 个 根 , 即 


i 
A,B = 一 一 
7 十 Us 


Dy 十 Ma 


$ + We2 21 ,us : 2 


(4.13) 

A 取 负 号 ,B 取 正 号 ,P= Y, /nn. 
因为 (4.11) 和 (4.12) 只 是 近似 的 , 故 区 间 估 计 [A,B] 的 置信 
系数 ,也 只 是 近似 地 等 于 1 一 a. 当 较 大 ,例如 nn 宇 30 时 ,相去 不 
还 ,实际 上 ,n 太 小 时 , 找 p 的 区 间 估 计 意 义 不 大 .因为 这 种 区 间 
都 失 之 过 长 ,实际 意义 不 大 .这 可 由 下 面 的 分 析 看 出 :由 于 0 过 $5 声 
1,7(1 一 ) 的 最 大 值 可 为 144. 这 时 ,区 间 [A ,Bj] 之 长 ,在 把 $5(1 


一 方 ) 改 为 1 人 4 后 ,为 us/v n+u?bp: 取 a=0.05, 有 usp=1.96. 
看 要 求 这 区 间 之 长 不 超过 0.3( 这 是 一 个 很 低 的 要 求 ) ,必须 1.96/ 
V n+(1.96)*<<0.3. 算 出 至 少 应 为 39. 可 以 看 出 ;在 试验 次 数 
7 低 寺 40 时, 求 p 的 区 间 估 计 没 有 多 大 实用 意义 . 
例 4.6 设 Xi …,X, 为 抽 自 有 波 蛙 松 分 布 P(4) 的 总 体 的 
样本 , 求 4 的 区 间 估 计 . 
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记 YY =Xi+…+X. 设 2 相当 大 ,注意 到 波 哇 松 分 布 的 均 
值 方差 都 是 4, 由 第 三 章 定理 4.2, 知 ( -mn)/V 坟 近似 地 有 分 
布 N(0,1). 仿 前 例 的 做 法 , 即 得 到 4 的 区 间 估 计 [A ,Bj],A,B 为 
一 次 方程 

(Y,— nA )* 二 NnAu® 


的 两 根 , 即 
A,B = XX+ up/2n) tu pv apA4722) 十 和 AH 


(4.14) 
A 取 负 号 ,B 取 正 号 ,X= Y,/n. 

例 4.7 设 某 总 体 有 均值 9, 方 差 o .0 和 o? 都 未 知 , 从 这 总 
体 中 抽出 样本 XX ,…,X, ,要 作 6 的 区 间 估 计 . 

因为 对 总 体 分 布 没 有 作 任 何 假定 ,要 作出 满足 条 件 1' 一 4 的 
板 轴 变量 是 不 可 能 的 .但 是 ,者 n 相当 大 , 则 据 中 心 极限 定理 (第 
三 章 定理 4.2), 有 Vn(X-0)/o~N(0,1). 但 此 处 o 未 知 , 仍 不 
能 以 v n(X -9)/o 作为 枢 轴 变量 . 因为 n 相当 大 ,样本 均 方 差 S 
臣 o 的 一 个 相合 估计 , 故 可 近似 地 用 S 代 c ,得 

Vn(X— 0)/S ~ N(0,1) 
由 此 就 不 难得 出 6 的 区 间 估 计 
[X-— Spsp2/ Vn ,X + Spsna/ Vn ] 
它 的 置信 系数 , 当 n 相当 大 时 ,近似 地 为 1- .近似 的 程度 如 何不 
仅 取 次 于 ?7 的 大 小 ,还 要 看 总 体 的 分 布 如 何 . 

例 4.8 考虑 在 例 4.2 中 提出 的 贝 伦 斯 - 费 吹 尔 问 题 : XX,， 
…,X, 是 从 正 态 总 体 N(y,o1) 中 抽出 的 样本 ,Yi ,…,Y,, 是 从 正 
态 总 体 N(pa ci) 中 抽出 的 样本 ,要 求 1 =- ws 的 区 间 估 计 . 

在 本 例 中 有 

[(X -YY) - (py1 一 12) ]/V oF 十 G3 /1 ~ N(0,1) 
(4.15) 
这 里 没有 近似 :分 布 是 严格 成 立 的 ,但 是 ,由 于 ci,c, 未 知 ,(4.15) 
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并 不 构成 枢 轴 变量 .如果 n,m 都 相当 大 , 则 of 和 03 分 别 可 用 X 
样本 的 样本 方差 Sf 和 YY 样本 的 样本 方差 $5 近似 地 代替 之 ,得 

[CX -YF)- (pr p2)]/V Sin + Si/m~ N(O,1) 

(4.16) 

与 (4.15) 不 同 , (4.16) 只 是 近似 而 非 严 格 . (4.16) 可 作为 枢 轴 变 
量 ,而 得 出 jy 一 yo 的 区 间 估 计 . 当然 ,其 置信 系数 只 是 近似 的 . 

例 4.5 一 4.8 所 导出 的 区 间 估 计 , 叫 “大 样本 区 间 估 计 ”. 一 般 
如 果 一 个 统计 方法 是 基于 有 关 变 量 的 当 样 本 大 小 n 很 大 时 的 极 
限 分 布 , 则 称 这 一 统计 方法 为 “大 样本 方法 ”. 反 之 ,车 依据 的 是 有 
关 变 量 的 确切 分 布 , 则 称 为 “小 样本 方法 ”如 例 4.,1 一 4.4 导出 的 
区 间 估 计 就 是 小 样本 区 间 估 计 . 这 不 在 于 n 多 大 多 小 :在 例 4.1 一 
4.4 中 ,即使 样本 大 小 x = 10", 仍 是 小 样本 方法 .对 例 4.5 而 言 ， 
因 使 用 的 是 极限 分 布 ,即使 n = 40, 仍 算是 大 样本 方法 ,不 言 而 喻 ， 
大 样本 方法 只 有 在 样本 大 小 较 大 时 才 宜 于 使 用 . 


4.4.4 置信 和 界 


在 实际 问题 中 ,有 时 我 们 只 对 参数 6 的 一 端的 界限 感 兴 趣 . 
例如 ,6 是 在 一 种 物质 中 某 种 杂质 的 百分率 , 则 我 们 可 能 只 关心 其 
上 界 , 即 要 求 找到 这 样 一 个 统计 量 0 ,使 16 委 的 概率 很 大 . 6 就 称 
为 9 的 置信 上 界 ( 或 上 限 ). 又 如 ,9 是 某 种 材料 的 强度 , 则 我 们 可 
能 只 关心 其 下 界 , 即 要 求 找 到 这 样 一 个 统计 量 9, 使 {19 宇 91 的 概率 
很 大 .9 就 称 为 9 的 置信 下 界 ( 或 下 限 ). 下 面 给 出 正式 的 定义 ,为 行 
文 简单 ,就 以 一 个 参数 9 的 情况 为 例 . 

定义 4.2 设 X1,…,X, 是 从 某 一 总 体 中 抽出 的 样本 ,总 体 
分 布 包含 未 知 参数 9,9 = 0( 久 | ,…, XX; ) 和 0 = 90(X 义 | ,…, XX, ) 都 是 
统计 量 ( 它 们 与 6 无 关 ) , 则 

1. 阁 对 6 的 一 切 可 取 的 值 有 

Po(O(X1,%,X,)0)=1-a (4.17) 
则 称 9 为 6 的 一 个 置信 系数 为 1- a 的 置信 上 界 ; 
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2. 车 对 6 的 一 切 可 取 的 值 有 
POCOX 3 X SO0)=1-a (4.18) 
则 称 6 为 9 的 一 个 置信 系数 为 1 一 a 的 置信 下 界 . 

把 (4.17) 与 (4.18) 与 区 间 估 计 的 置信 系数 定义 去 比较 ,看 出 : 
曾 信 上 上、 下界 无 非 是 一 种 特殊 的 置信 区 间 ,其 一 端 为 co 或 - co . 因 
此 ,前面 用 于 求 区 间 估 计 的 方法 ,都 很 容易 平行 地 移 至 此 处 . 例如 ， 
找 N(py oz) 的 均值 w 的 置信 下 界 , 假定 cz 已 知 , 以 
Vn(X 一 1)/o 为 枢 轴 变量 ,其 分 布 为 N(0,1). 有 

Pl(/n(X- w/oeSu)=1-a 
此 式 可 改写 为 
Pl(yX-uo/V/n)=1-a (4.19) 
把 (4.19) 与 (4.18) 比 较 , 即 知 X 一 uo/V7 为 n 的 一 个 置信 下 界 ， 
置信 系数 为 1 一 a. 将 这 个 方法 用 于 以 前 讨论 过 的 诸 例 ,得 出 一 些 
置信 上 .下 界 的 结果 ,例如 (记号 均 见 有 关 各 例 ); 
1. 例 4.1 ww 的 置信 上 、 下 界 分 别 为 ( 正 号 为 上 界 ) 
XX+ Si，i(a)/ Vn 
2. 例 4.2 jp 一 2 的 置信 上 .下界 分 别 为 ( 正 号 为 上 界 ) 


(X — Y)+ St a) Lz 


nt 
3. 例 4.3 oa? 的 置信 上 界 为 (n 一 1)S?/Xi-1(1 一 a), 下 界 为 
(7 一 1)S27X2 1(a). 
以 上 置信 系数 都 是 1 - a ,其余 各 例 都 与 此 类 似 ,我 们 注意 到 
-点 :在 置信 区 间 中 的 w/ 在 这 里 都 被 a 取代 . 这 是 由 于 区 间 信 
计 是 双 侧 的 . 共 为 a 的 概率 由 两 边 均 分 ,各 占 a/2. 而 置信 和 界 则 是 
单 侧 的 . 


4.4.5 贝 叶 斯 法 


用 贝 叶 斯 法 处 理 统计 问题 的 基本 思想 ,已 在 4.2 节 4.2.4 中 
前 述 过 了 .用 它 来 处 理 区 间 估 计 问 题 ,概念 上 和 做 法 上 都 很 简单 ; 
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沿用 4.2 节 4.2.4 中 的 记号 .在 有 了 先 验 分 布 密度 h (90) 和 样本 


Xi1,…, 义 , 后 ,算出 后 验 密度 4(9| X1,…,X,). 再 找 两 个 数 61,6， 
都 与 Xi,…,X, 有 关 , 使 


0, 
;A(0| Xi X,)d 一 1 a (4.20) 


区 间 [01,0, |] 的 意思 是 ;在 所 得 后 验 分 布 之 下 ,9 落 在 这 区 间 内 的 


概率 为 1- c. 因 此 ,[6 ,02] 可 作为 0 的 一 区 间 估 计 , 其 后 验 信 度 
为 1-a.“ 后 验 ”" 是 指 “ 有 了 样本 以 后 ”的 意思 . 因此, 所谓“ 后 验 信 
度 为 1- c”, 可 以 解释 为 :在 已 有 了 样本 以 后 ,我 对 区 间 
[9 ,02>] 能 包含 未 知 参数 9 的 相信 程度 为 1 一 a. 这 与 奈 曼 理 论 中 
的 置信 系数 的 含义 相似 ,但 理论 观念 上 有 别 . 因为 这 里 整个 架构 根 
本 不 同 . : 

如 果 要 找 贝 叶 斯 上 下 界 , 则 只 须 把 (4.20) 分 别 改 为 


| ACO| Xi X)d9 =1-a( 上 界 ) (4.21) 


| nOl Xi Xd0 = 1-a( 下 界 ) (4.22) 


对 (4.20) 而 言 还 有 一 个 问题 :满足 条 件 (4.20) 的 56,6， 很 多 ,如 何 
决定 一 对 ”一般 是 以 使 O; - 人 包 最 小 为 原则 * (也 可 以 是 使 9,/0) 
最 小 ,这 要 看 参数 的 性 质 与 实际 问题 中 的 要 求 如 何 而 定 ), 下 面 将 
通过 例子 解释 这 一 点 . 

例 4.9 ”考虑 例 2.14. 在 该 例 中 所 规定 的 先 验 分 布 之 下 , 找 6 


* 另 一 种 可 取 的 方法 是 找 9 , ,9 ,使 


0 co 
| lp(0| XI ,X,)dg = a/2, |: h(0| XI,', X,)d0 一 av 
bn 2 
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的 区 间 佑 计 . : 

在 该 例 中 已 找 出 8 的 后 验 分 布 为 N(i, 六 ),zt, 广 分 别 由 
(2.17),(2.18) 决 定 ,这 个 密度 函数 在 t 点 处 达到 最 大 值 ,然后 在 
两 边 对 称 地 下 降 . 由 此 易 见 ,如 要 找 0; 和 09, 满足 (4.20) 式 , 它 只 
有 在 6,,0,=t 土 c 时 才能 使 98, 8, 最 小 .由 正 态 分 布 即 知 ,c 必须 
取 为 mys. 于 是 得 出 贝 叶 斯 区 间 估 计 

[£ ~ Marst + Mien | 
其 后 验 信和 度 为 1 一 a. z 
例 4.10 考虑 例 2.13. 在 此 已 求 出 当 取 R(0,1) 为 先 验 分 布 
时 ,p 的 后 验 密度 为 
hp(p|X1,.…, X,) 
=pX(l -pp)" */B(X+1,n-X+1),0<p 14.23) 
要 找 广 | ,pp， ,使 


? 
jd ~ p)” Ydp/B(X+1,n—-X+1)=1-a 


并 使 Bp, 一 户 | 最 小 ,问题 就 麻烦 些 . (4.23) 
的 图 形 大 致 如 图 4.3. 它 在 点 p= 二 针 /An 处 
达到 最 大 ,然后 往 两 边 下 降 . 故 只 有 图 中 
c,d 那 种 对 子 , 才 能 使 &- c 最 小 .方法 
是 : 先 在 Xvz 左边 取 定 一 个 值 c .由 方程 
~(l Cn 从 一 p*(1 p)”™ > 
以 p 为 未 知 量 , 解 出 p=4. 从 图 4.3 看 4.3 
出 ,d 人 大 于 X/n .计算 积分 


d 
| pll-c)" dp/AX+1,n-X+1)=A 


奋 A>1-a, 表 示 c 取得 太 小 .车 A<1 一 a, 则 表示 c 取得 太 
大 .经 过 几 次 调整 后 即 可 找到 足够 接近 的 近似 值 . 
与 奈 曼 的 理论 相 比 ,我 们 看 出 ,这 里 求 区 间 估 计 的 过 程 容易 多 
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了 .固然 ,在 寻找 适合 (4.20) 的 6 和 0, 时 ,往往 计算 很 繁 ,但 并 无 
原则 困难 ,用 计算 机 也 很 容易 实现 .但 用 奈 曼 的 方法 , 则 涉及 到 麻 
烦 的 分 布 问题 .如 例 4.1 一 4.4 这 几 个 例 , 就 基于 有 关 的 统计 量 服 
从 :分 布 , 卡 方 和 下 分 布 等 .这 不 是 常 有 的 情况 ,而 只 是 少见 的 几 
个 特例 ( 辛 好 这 几 个 特例 在 实用 中 用 得 很 多 ). 往 往 由 于 分 布 问 题 
无 法 解决 ,而 只 好 求助 于 大 样本 理论 .实用 上 往往 样本 不 很 大 ,使 
我 们 对 由 此 而 产生 的 误差 ( 即 实际 的 置信 系数 与 名 义 的 置信 系数 
的 距离 ) 不 其 了 然 . 贝 叶 斯 方法 不 存在 这 些 问 题 . 当然 , 贝 叶 斯 方法 
有 其 自身 的 问题 , 即 先 验 分 布 如 何 定 , 这 一 点 我 们 在 前 面 已 提 过 
了 . 


站 题 


1. 设 Xi1,"…, XX 是 抽 自 负 二 项 分 布 的 样本 , 求 问 的 矩 估计 与 极 大 似 然 
估计. 


2. (a) 设 a1,…,a 是 个 实数 ,定义 函数 h(a) = yo -a| .证 
明 : 当 a 为 a1,…,as 的 样本 中 位 数 ( 见 4.29) 式 ) 时 ,h(a) 达 到 最 小 值 . (b，) 


设 X1,…,X, 为 自 具 概率 密度 函数 廊 e-1*-91 中 抽出 的 样本 (这 个 分 布 叫 拉 
普 拉 斯 分 布 ), 求 参数 9 的 矩 估计 与 极 大 似 然 估计 z 

3. 设 X1,…,X, 为 抽 自 均匀 分 布 R(0,20) 的 样本 , 求 9 的 矩 估计 与 极 
大 似 然 估计 

4. (a) 证明 

fz3a,0) = (V2z0) (x aferp(~ a(x — ay) 
一 ce 所 并 所 co 

作为 xz 的 函数 是 概率 密度 ,其 中 ac 为 参数 , - co< ua< co,c>0. 

(b) 设 Xi …,X, 为 抽 自 此 总 体 的 样本 , 求 a 和 o? 的 和 矩 估计 . 

(c) 列 出 a,o? 的 极 大 似 然 估计 所 满足 的 方程 ,并 指出 一 种 琶 代 求解 的 
方法 . 

5. 设 X 为 抽 自 波 畦 松 分 布 P(A) 的 样本 (样本 大 小 为 1) ,参数 A 有 先 验 
密度 h(A)=e “( 当 4>0.4(4)=0 当 4 二 0). 试 求 4 的 贝 叶 斯 估计 . 
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6. 设 Xi,…，,X,， 为 抽 自 指数 分 布 的 样本 .分 布 中 的 参数 有 先 验 密度 
(A)=Ae* 当 XA>0,h(4)=0 当 X 三 0. 求 4 的 贝 叶 斯 估计 . 
7. (a) 设 N,n,m 都 是 自然 数 ,n 二 N. 证 明 组 合 公 式 


(注意 : (“=0 当 “< 


人 人 人 re 


mo \r 刀 一 工 7 十 1 


(b) 设 X 为 抽 自 超 几 何 分 布 


per 人/ 人) 


的 样本 , M 为 未 知 参 数 ,其 先 验 分 布 为 
P(M = k)= 1AN+1),k =0,1,,N 
试 利用 (a) 的 结果 证 明 :M 的 中 叶 斯 估计 为 


M(z) = (N+2)(X+1)/(n+2)-1 

8. 设 X 为 抽 自 二 项 分 布 B(n,p) 的 样本 ,n 已 知 ,p 为 未 知 参 数 .证 明 : 
对 任何 常数 c,d,d>>c>>0, 可 找到 p 的 先 验 分 布 ( 可 以 为 广义 的 ), 使 p 的 贝 
叶 斯 估计 为 (XX+c)/An+d). 

9. 设 X 为 抽 自 二 项 分 布 B(n,p) 的 样本 ,n 已 知 ,而 p 为 未 知 参数 . (a) 
作 p? 的 一 个 无 偏 估 计 .(b) 证 明 : 若 g(p) 有 无 偏 估计 存在 , 则 g(p) 必 是 p 
的 不 超过 n 阶 的 多 项 式 . (c) ” 反 过 来 ,对 p 的 任 一 不 超过 nn 阶 的 多 项 式 
8(pP), 它 的 无 偏 估 计 必 存在 . 

10. 设 六 1,…,X 为 抽 自 RR(0,9) 的 样本 . (a) 证 明 :91= max( Xi， …， 
Ni) tmin(X1,…,X) 是 6 的 一 个 无 偏 估计 .(b) 证 明 :对 适当 选择 的 参数 


Cj 0， 一 cmin(CXi 9 , Xn) 是 9 的 无 偏 估 计 . 但 这 个 估计 的 方差 比 田 外 两 个 
无 俩 估计 53 = 和 6 ,= 下 一 max(X1,…,X,) 都 大 (除非 n=1). 
11. 设 X 为 盾 自 波 哇 松 分 布 P(A) 的 样本 .(a) 证 明 :g(4)=e-* 的 叭 


-的 无 偏 估计 0 (X) 为 :01(X)=1 当 义 为 偶数 ,9,(X)= 一 1 当 义 为 奇数 . 
(b) 你 认为 (a) 中 的 合计 是 否 合理 ?如 不 合理 , 试 提出 一 个 合理 的 估计 . 


12. 设 入 1 为 抽 自 正 态 总 体 N(a,o?) 的 样本 ， 则 已 知 0) 一 


7 (NX; -又 )2 为 oz 之 一 无 偏 估 计 . 证 明 :0;= 王 二 15， 虽 非 o2 的 无 偏 
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估计 ,但 9, 的 均 方 误差 较 小 , 即 :EE(9, - o2)2< (0 -co2)2. 本 题 及 11 题 都 
说 明 : 无 偏 估计 不 一 定 是 最 好 的 选择 . 


13. 设 在 12 题 中 4 已 知 .(a)” 则 0 = Tox - a)? 也 是 o? 的 无 偏 


估计 . 且 其 方差 小 于 上 题 中 的 估计 6 的 方差 . (b) ”进一步 证 明 :03 是 co? 的 
MVU 估计 . 
14. 设 X ，…,X, 是 从 具 概 率 密度 函数 
2wv6Lrexp(- x), x>0 
0 ， 过 挟 0 


f(z,0) = 


的 总 体 中 抽出 的 样本 .证 明 : 对 适当 选择 的 常数 C, 6 = C 》)X3?/n 是 1/6 的 
MVU 估计 ， 业 

15. (a) 若 61,6, 都 是 9 的 MVU 估计 , 则 (了 1+5) 久 也 是 .(b) 车 
是 9 的 MVU 估计 而 a 考 0 各 都 是 已 知 常数 , 则 a0+65 是 a9+6 的 MVU 


估计 . 
16. 设 Xi1,…,X; 为 从 某 一 个 具 均 值 9 而 方差 有 限 的 总 体 中 抽出 的 样 


本 .证 明 : 对 任何 常数 c1,…, ci, 只 要 D>, - = 1 , 则 DD eX 必 是 9 的 无 偏 估 


计 . 但 是 ,只 有 在 ci =cyz=…=c=1Anz 时 ， 方差 达到 最 小 ( 指 在 上 述 形式 的 
估计 类 中 达到 最 小 .实际 可 以 证 明 :X 在 9 的 一 切 无 偏 估计 类 中 方差 也 达到 
最 小 ). 

17. 设 久 | ,…,X, 为 抽 自 均匀 分 布 R(0,9) 中 的 样本 . 证明: 对 任 给 的 
1-a(0<1-a<1), 可 找到 常数 c ,使 [max (Xi,…,X,), cmax(Xi,… 
X,)] 为 9 的 一 个 置信 系数 1- a 的 区 间 估 计 ， 

18. 设 XX ，,…,X, 和 六 ,…, YY 分 别 是 抽 自 正 态 总 体 N(0,o?) 和 N(9， 
o3) 的 样本 ,oc? 和 co 都 已 知 . (a) ” 找 常数 c,d, 使 9 =c 久 +d YY 为 9 的 无 偏 
估计 .并 使 其 方差 最 小 (在 所 有 形 如 a X + bY 的 无 偏 估计 类 中 最 小 ).(《b) 
基于 0 ,作出 9 的 置信 系数 为 1 -a 的 置信 区 间 . 

19. 设 Xi,…，,X， 是 抽 自 具 参 数 4| 的 指数 分 布 的 样本 ,YY ,…,Y,, 是 抽 
自 具 参 数 为 4, 的 指数 分 布 的 样本 , 试 求 MA 的 区 闻 估 计 . 

20. 设 X1,X 为 抽 自 有 具 密 度 郴 数 
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(xz,0) = 
A 0,r<0 
的 总 体 的 样本 .参数 8 的 先 验 密度 为 
er,0>0 
A(O) 二 全 
0,0 反 0 


求 日 的 中 时 斯 区 间 信 计 . 
21. 证 明 (3.2) 式 . 


22. 设 入 1,…,X, 为 抽 自 均匀 分 布 总 体 尺 (0 ,92) 的 样本 .证 明 : 存 在 只 


依 帆 于 的 常数 c ,使 针 -cS 和 X+cs 分 别 是 外 和 6 的 无 偏 估计 . 


23. 设 Xi ，,X 为 抽 自 正 态 总 体 N(6,c2) 的 样本 ,0 和 都 未 知 .证 


明 . 六 仍 为 9 的 MVU 估计 . 
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第 五 章 假设 检验 


5.1 问题 提 法 和 基本 概念 
5.1.1 例子 与 问题 提 法 


假设 检验 的 概念 在 第 四 章 4.1 节 中 就 曾 提 到 了 .这 里 我 们 先 
通过 对 几 个 常用 例子 的 分 析 ,总 结 出 假设 检验 问题 提 法 的 形式 . 然 
后 在 这 个 基础 上 ,引进 关于 假设 检验 的 一 些 基 本 概念 . 

例 1.1 在 4.1 节 中 我 们 曾 提 到 一 个 在 元 件 寿 命 服从 指数 分 
布 的 假定 下 ,通过 对 抽出 的 若干 个 元 件 进行 测试 所 得 的 数据 ( 样 
本 ), 去 判定 “元 件 平均 寿命 不 小 于 5000 小 时 ”是否 成 立 的 问题 . 

我 们 把 与 这 个 问题 有 关 的 事项 ,用 统计 学 的 语言 清楚 列 出 如 
下 : 

1. 我 们 有 一 个 总 体 , 即 所 考察 的 那 一 大 批 元 件 的 寿命 . 我们 
对 总 体 分 布 作 了 一 个 假定 , 即 它 服从 指数 分 布 (第 二 章 (1.20) 式 )， 
该 分 布 包 含 了 一 个 末 知 参数 4. 

2. 我 们 有 从 该 总 体 中 抽出 的 样本 Xi,…，,X,( 即 抽出 的 那 n 
个 元 件 测试 出 的 寿命 ). 

3. 我 们 有 一 个 命题 ,其 正确 与 否 完全 取决 于 未 知 参数 4 之 
值 , 即 “1A4 宇 5000”. 它 把 参数 4 的 所 有 可 能 取 的 值 0< 和 A< co 分 
成 两 部 分 :一 部 分 是 Ho = 14:4 志 1450001 ,一 部 分 是 五 | = 14:4> 
1/50001. 五 o 内 的 4 值 使 上 述 命题 成 立 ,而 日 | 内 的 4 值 则 使 上 述 
命题 不 成 立 .故我 们 的 命题 可 记 为 :“4 属于 Ho” 或 用 符号 写 为 “AE 
Ho” ,以 至 简 记 为 “Ho”. 

4. 我 们 的 任务 是 利用 所 获得 的 样本 X|,…,X; ,去 判断 命题 
“AE Ho 是 否 成 立 .其 所 以 能 这 么 做 ,当然 是 因为 样本 中 包含 了 总 
体 分 布 的 信息 ,也 就 包含 了 AE€Ho” 是 否 成立 的 信息 . 
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在 数理 统计 学 上 ,把 类 似 于 上 述 “ XE Ho” 这 种 命题 称 为 一 个 
“假设 "或 “统计 假设 ”.“ 假 设 ” 这 个 词 在 此 就 是 一 个 其 正确 与 否 有 
待 通过 样本 去 判断 的 陈述 .不 要 把 它 和 通常 意义 相 混 .例如 在 数学 
上 和 常 说 “假设 某 消 数 处 处 连续 "之 类 的 话 , 那 是 一 个 所 讨论 的 问题 
中 己 被 承认 的 前 提 或 条 件 ,与 此 处 所 讲 的 完全 不 同 . 

在 数理 统计 学 上 ,通用 “检验 ”一 词 来 代替 上 文 的 “判断 ”. 检验 
一 词 有 动词 名 词 两 种 含义 .动词 含义 是 指 判 断 全 过 程 的 操作 ,而 名 
词 的 合 义 是 指 判 断 准则 . 例如 ,就 本 例 而 言 一 个 看 来 合理 的 判断 准 
则 是 :“ 当 XX 宇 C 时 认为 假设 XE Ho 正确 ,不 然 就 认为 它 不 正确 ” 
(C 是 一 个 适当 的 常数 ,以 后 再 谈 ). 这 就 是 一 个 检验 (名 词 ).“ 认 
为 假设 正确 在 统计 上 称 为 接受 该 假设 ;“ 认 为 假设 不 正确 ”在 统计 
上 称 为 否定 或 拒绝 该 假设 .到 此 为 止 统计 间 题 可 以 说 已 完成 了 :至 
于 接受 或 否定 假设 以 后 如 和 何 办 (如 在 本 例 中 ,车 认为 4 宇 1/5000 不 
成 立 ,该 如 何 处 理 )? 这 不 是 我 们 要 考虑 的 事 . 

以 下 几 例 的 解释 都 与 上 述 过 程 完 全 平行 . 

例 1.2 有 人 给 我 一 根 金条 ,他 说 其 重量 为 312.5 克 . 我 现在 
拿 到 一 架 精 密 天 平 上 重复 秤 7? 次 ,得 出 结果 为 Xi …,X .我 假定 
此 天 平 上 秤 出 的 结果 服从 正 态 分 布 N(y,o?)( 这 是 一 个 假定 , 它 
己 补 承认 ,不 是 检验 对 象 ). 这 时 ,我 要 检验 的 假设 为 . “x = 
312.5 .在 本 例 c 可 以 已 知 或 未 知 . 如果 o 未 知 , 则 总 体 分 布 含 多 
个 参数 ,但 假设 可 以 只 涉及 其 中 一 个 .问题 也 可 以 是 检验 方差 ( 当 
然 , 在 方差 o* 未 知 时 ):; 比如 , 人 家 告诉 我 这 天 平 的 误差 方差 为 
10 (8 ) ,我 怀疑 它 是 否 如 此 ,这 时 我 可 以 拿 一 个 物件 在 该 天 平 
上 秤 2 次 得 XXX, 利 用 这 些 数据 去 检验 假设 “c2 = 10-42”. 仍 
假定 总 体 为 正 态 分 布 NCp,az),Aw 就 是 那个 物件 之 重 , 它 可 以 已 
知 ( 例 如 你 拿 一 个 其 重量 已 经 测定 的 物体 去 秤 ) ,也 可 以 未 知 . 

例 1.3 某 工 三 一 种 产品 的 一 项 质量 指标 假定 服从 正 态 分 布 
N(p1,0”). 现 在 对 其 制造 工艺 作 了 若干 变化 ,人 们 说 结果 质量 起 
了 变化 或 有 了 改进 .我 想 通过 样本 来 检验 一 下 . 

假定 修改 工艺 后 ,质量 指标 仍 服从 正 态 分 布 , 且 只 均值 可 能 
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变 而 方差 不 变 , 即 分 布 为 N(yo,o ). 我 把 要 检验 的 假设 定 为 
Ho: tp 一 1 | 

或 ( 设 均值 大 时 ,质量 为 优 ) 
Ho' : {p12 po 

这 要 仔细 解释 一 下 . 

选 五 , ,是 针对 "质量 起 了 变化 ”的 说 法 .由 于 你 不 能 凭空 说 jo 
不 等 于 Ai ,我 就 先 作 假设 Ho. 如 果 经 过 检验 Ho 被 否定 了 , 则 我 
承认 质量 起 了 变化 ,不然 就 只 好 仍 维持 Ho. 自然 ,你 可 能 辩驳 说 ， 
为 何不 取 | ul 关 p31 作为 假设 去 检验 ”这 不 也 一 样 :你 接受 了 人 它 ， 
即 为 质量 确 有 变化 ;车 否定 了 它 , 则 认为 无 变化 . 从 表面 上 看 这 个 
提 法 无 可 非议 ,因为 两 种 提 法 从 实质 上 看 只 是 表述 方式 不 同 . 但 有 
其 不 可 这 样 做 的 理由 ,这 一 点 在 以 后 将 子 以 解释 ,现在 还 说 不 清 
楚 . 

选 Ho 是 针对 “质量 有 了 改进 的 说 法 ,与 上 文 类 似 . 

本 例 中 o“ 可 以 是 已 知 或 未 知 , 在 应 用 上 以 未 知 的 情况 居多 . 
又 “工艺 变化 前 后 质量 方差 一 样 " 是 一 个 多 少 有 点 人 为 的 假定 (一 
般 ,质量 的 改进 也 稼 反映 在 其 波动 变 小 上 , 即 方差 会 小 些 ). 如 假定 
前 后 方差 不 一 样 , 则 得 到 贝 伦 - 费 希 尔 检验 问题 ,这 是 数理 统计 学 
上 的 一 个 著名 的 问题 ,其 区 间 和 估计 形式 已 在 前 章 讲 过 了 . 

如 宁 不 认为 质量 的 平均 值 有 多 大 问题 ,而 问题 在 其 方差 上 , 则 
假定 在 工艺 改变 前 后 ,质量 指标 的 分 布 分 别 为 N(x1,of) 和 和 
N (yw,05). 这 时 要 检验 的 假设 可 以 是 “of= c 和 或 “ai 委 cc 和 

例 1.4 甲乙 两 位 棋 手 下 棋 . 共 下 局 , 甲 pm 胜 n 一 m 负 
( 设 无 和 局 ). 根 据 这 一 结果 对 两 位 棋 手 的 技艺 是 否 有 差别 下 一 个 
判断 ， 

大 以 p 记 每 局 中 甲 胜 的 概率 , 则 乙 胜 的 概率 为 1 -pp. 假 定 每 
局 的 结果 独立 (这 很 接近 事实 ,除非 其 中 一 位 或 两 位 的 心理 素质 
差 ,以 致 已 赛 各 局 的 结果 显著 地 影响 着 他 的 情绪 ). 则 若 以 X 记 在 
n 局 中 甲 胜 的 局 数 ,将 有 X 一 B(n,p). 我 们 的 问题 可 提 为 :检验 
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假设 “p=1/2”. 

例 1.5 有 一 颗 供 赌博 或 其 他 用 途 的 般 子 ,怀疑 它 是 否 均匀 ， 
要 用 投掷 若干 次 的 结果 去 检验 它 . 若 以 掷 出 点 数 的 概率 分 布 来 表 
示 , 所 要 检验 的 内 容 可 表 为 假设 

Ho:p1 = p22= "= pe= 1 (1.1) 
这 里 p; 是 骨 子 撕 出 i 点 的 概率 .这 意味 着 把 骨 子 的 均匀 性 解释 
为 : 它 掷 出 任何 一 点 的 机 会 都 相同 . 

从 以 上 诸 例 我 们 明确 了 假设 检验 问题 的 提 法 .现在 介绍 假设 
检验 中 几 个 常用 的 名 词 . 

1. 原 假设 和 对 立 假设 

在 假设 检验 中 , 常 把 一 个 被 检验 的 假设 叫做 原 假设 ,而 其 对 立 
面 就 叫做 对 立 假 设 . 如 在 例 1.1 中 , 原 假设 为 Ho:X 碌 175000, 故 
对 立 假设 为 日 i :4 >>175000. 在 例 1.5 中 , 原 假设 Ho 为 (1.1) ,而 
对 立 假设 为 昌 | :“ p11,…, pse 不 完全 相同 ”. 

原 假设 中 的 “ 原 " 字 ,字面 上 可 解释 为 “原本 有 的 ”. 如 在 例 
1.2, 你 可 以 说 y=312.5 原本 就 不 存在 问题 ,只 因 有 人 怀疑 , 才 提 
出 了 也 存在 yy 关 312.5 的 可 能 .= 312.5 是 “ 原 有 ”的 而 p 关 
312.5 是 “后 来 的 ”. 这样 的 解释 也 并 非 处 处 适合 ( 见 下 ) ,的 确 , 对 
这 个 “ 原 " 字 不 必 硬 加 一 种 解释 . 

原 假设 又 常 称 为 “ 零 假设 ”或 “ 解 消 假设 ”* .这 名词 的 含义 拿 
例 1.3 中 的 假设 Ho:p1= ys 去 看 最 贴切 .因为 ,1 一 yo 反映 工艺 
变化 后 所 产生 的 效应 .你 这 个 假设 五 把 这 个 效应 化 为 零 了 ,或 把 
这 个 效应 “ 解 消 ”了 .不 难 理解 :在 有 些 情况 下 这 个 名 词 也 并 非 很 贴 
切 , 故 也 有 不 少 人 不 高 兴 用 这 名 称 . 

对 立 假设 就 是 与 原 假设 对 立 的 意思 . 这 个 词 既 可 以 指 全 体 , 也 
可 以 指 一 个 或 一 些 特殊 情况 ,例如 对 例 1.1, 我 们 说 对 立 假 设 是 
A 之 1/5000, 这 是 指 全 体 .但 也 可 以 说 A=1.5 是 一 个 对 立 假设 ,这 
无 非 是 指 1.5 这 个 值 是 对 立 假 设 的 一 个 成 员 . 对 立 假设 也 常 称 为 


* 霉 假设 或 解 消 假设 都 是 从 英语 Null Hypothesis 一 词 而 来 . 
“。 211 : 


“ 答 择 假设 ” ,其 含义 是 :在 抛弃 原 假 设 后 可 供 选 择 的 假设 . 

2. 检验 统计 量 ,接受 域 .否定 域 临界 域 和 临界 值 

在 检验 一 个 假设 时 所 使 用 的 统计 量 称 为 检验 统计 量 . 拿 例 
1.1 来 说 ,我 们 前 已 提 人 到 了 一 个 在 直观 上 合理 的 检验 : 当 X 宇 C 时 
接受 原 假 设 ,不 然 就 否定 .这 里 用 的 检验 统计 量 是 义 . 

使 原 假 设 得 到 接受 的 那些 样本 (X|,…,X,) 所 在 的 区 域 A， 
称 为 该 检验 的 接受 域 , 而 使 原 假设 被 否定 的 那些 样本 所 成 的 人 区域 
R , 则 称 为 该 检验 的 否定 域 . 否定 域 有 时 也 称 为 拒绝 域 ,临界 域 .如 
在 例 1.1 中 ,刚才 所 提 到 的 检验 的 接受 域 为 

A= (XXX +…+X 二 TAOC| 


R= 1COX XXXI+ +X < nC 
A 与 R 互补 , 知 其 -一 即 知 其 二 . 定 一 个 检验 ,等 价 于 指定 其 接受 域 
或 否定 域 . 

在 上 述 检验 中 , C 这 个 值 处 于 一 个 特殊 的 地 位 :X 之 值 一 越 
过 C 这 个 界线 ,结论 就 由 接受 变 为 否定 . 这 个 值 C 称 为 检验 统计 
量 X 的 临界 值 . 当心 中 明确 了 用 什么 统计 量 时 ,也 可 以 说 “检验 的 
临界 值 ”. 例如, 若 心 中 已 明确 用 统计 量 Xi + …+X , 则 临界 值 为 
2 也 可 以 有 不 止 一 个 临界 值 . 如 在 例 1.1, 若 要 检验 的 原 假 设 改 
为 人 三 1753000 , 则 一 个 合理 的 检验 法 是 : 当 Ci 和 受 X 雪 C, 时 , 接 
及 ,不然 就 否定 . Cl, C， 是 两 个 适当 选 定 的 常数 ,它们 都 是 临界 
值 . 

3. 简单 假设 和 复合 假设 

不论 是 原 假设 还 是 对 立 假设 , 若 其 中 只 含 一 个 参数 值 , 则 称 为 
简单 假设 ,否则 就 称 复合 假设 . 

如 在 例 1.1 中 , 原 假 设 4 志 1/5000 包含 所 有 大 于 0 而 不 超过 
1/5000 的 4 值 , 它 是 复合 的 ;对 立 假设 入 >>1/5000 也 为 复合 .再 看 
例 1.2. 若 or 已 知 , 则 原 假设 只 含 参 数 w 的 一 个 值 312.5, 故 是 -一 
个 简单 假设 ; 知 c- 未 知 , 则 原 假 设 包含 了 所 有 形 如 

(312.5,o ):o? 任意 
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的 参数 值 , 故 是 复合 的 .这 里 的 要 点 是 :在 决定 -- 个 假设 是 简单 偿 
是 复合 时 ,要 考虑 到 总 体 分 布 中 的 一 切 参数 ,而 不 止 是 直接 出 现在 
假设 中 的 那 部 分 参数 .如 在 本 例 ,c” 虽 则 不 出 现在 假设 中 ,但 因为 
它 是 总 体 分 布 的 未 知 参 数 , 故 仍 要 考虑 进来 . 这 种 参数 (如 此 处 的 
o“) 在 数理 统计 学 上 称 赣 余 参 数 在 区 间 估 计 中 这 个 名 词 也 常 提 
到 ,例如 在 正 态 总 体 NCw,c2) 中 ,wo 都 未 知 , 要 作 y 的 区 间 佑 
计 , 这 时 o- 就 是 缆 余 参数 . 


5.1.2 功效 函数 


功效 图 数 是 假设 检验 中 最 重要 的 概念 之 一 .在 以 下 将 看 到 : 同 
一 个 原 假设 可 以 有 许多 检验 法 ,其 中 自然 有 优 劣 之 分 .这 区 分 的 依 
撕 ,就 取决 于 检验 的 功效 函数 . 
例 1.6 再 考虑 例 1.1, 并 设 我 们 取 定 了 如 下 的 检验 G6: 
四: 当 X 宇 C 时 接受 ,不 然 就 否定 (1.2) 
如 果 我 们 使 用 这 个 检验 , 则 原 假设 电 ,:4 志 175000 被 接受 或 否定 ， 
都 是 随机 事件 ,因为 其 发 生 与 否 ,要 看 样本 X|,…,X, 如 何 , 而 样 
本 是 随机 的 .在 此 , 原 假设 被 否定 的 概率 为 
B36(4)= P(X<C) 
P; 的 意义 以 前 解释 过 , 它 是 指 事件 |X<Ci 的 概率 ,是 在 总 体 分 布 
的 参数 值 为 A 时 去 计算 的 . 因为 ( 见 第 二 章 例 4.9)2X4 (XI+ 
久 , ) 一 X55 , 故 如 以 Kz, 记 5, 的 分 布 孙 数 , 则 有 
Bs(4) =P(XI+ + X, < nC) 
= P(2A(Xi1 + + X,) < 2AnC) 
= K,, (2AnC) (1.3) 
其 值 与 有 关 , 且 随和 上升 而 增加 .因为 4 愈 大 ,离开 原 假设 ) 执 
1A000 就 愈 远 ,一 个 合理 的 检验 法 就 应 当 用 更 大 的 概率 去 否定 


” 英语 Nuisance Parametcr. 也 有 谋 为 “多 余 参 数 "或 “讨厌 参数 "的 ,含有 使 问题 复 
杂 化 的 意味 . 
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蕊 . 

函数 (1.3) 就 称 为 检验 (1.2) 的 功效 函数 .由 此 ,提出 下 面 一 般 
定义 : 

定义 1.1 设 总 体 分 布 包含 若干 个 未 知 参数 01 ，…, .万 0 古 
关于 这 些 参 数 的 一 个 原 假设 , 设 有 了 样本 XX!1,…,X; ,而 B 是 基 寸 


Bo(91,…, 扩 ) = P .…,6 (在 检验 四 之 下 ,Fo 被 否定 ) 
(1.4) 
它 是 未 知 参 数 01 ,Hh 的 函数 . 

容易 明白 : 当 某 一 特定 参数 值 (04,…，,0) 使 Ho 成 立时 ,我们 
希望 88( 人 1,…,94) 尽 量 小 ( 当 Ho 成 立时 我 们 不 希望 否定 它 ), 反 
之 , 若 (01,…,0%) 属 于 对 立 假设 , 则 我 们 希望 Bp (1,…, 句 ) 尽 量 
大 ( 当 Ho 个 成 立时 我 们 希望 否定 它 ). 两 个 检验 B81,®,( 同 一 个 原 
假设 的 ) 哪 一 个 更 好 地 符合 了 这 个 要 求 , 哪 一 个 就 更 好 ， 

由 于 当 (01,…, 9) 属于 对 立 假设 时 ,我 们 希望 功效 函数 值 By 
(91,…,9) 尽 可 能 大 , 故 在 (91,…,9) 属 于 对 立 假设 时 , 称 Bos (01, 
一 ,4) 为 检验 四 在 (91,…,94) 处 的 “功效 ”. 这 称呼 只 用 于 对 立 假 
设 处 .因为 , 当 (01,…,0i) 属 于 原 假设 时 ,Bp(01，,…, 的 ) 以 小 为 好 ， 
这 时 称 它 为 “功效 就 不 合 情 理 了 . 


5.1.3 两 类 错误 ,检验 的 水 平 


在 检验 一 个 假设 Ho 时 ,有 可 能 犯 以 下 两 类 (或 两 种 ) 错 误 之 
一 :1. Ho 正确 ,但 被 否定 了 ;2. Ho 不 正确 ,但 被 接受 了 .可 能 犯 
哪 一 类 错误 ,要 视 总 体 分 布 中 有 关 的 参数 值 而 定 . 如 在 例 1.1 中 ， 
若 参数 4 之 值 为 0.0001, 则 我 们 只 可 能 犯 第 一 种 错误 ,而 当 ) = 
0.1 时 , 则 只 可 能 犯 第 二 种 错误 . 

车 以 0 …，,6 记 总 体 分布 的 参数 , Bp (01,…, 0;) 记 检验 @ 
的 功 歼 苹 数 , 则 犯 第 一 、 二 类 错误 的 概率 alg (01,…, 0, ) 和 和 QI 
(9 ,…,0i) ,分 别 为 
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Be,00, 当 (0,9D)E Ho 
0 当 (01,…,0) EH, 
0， 当 (0.,… ,0.)EHo 
0 
这 里 昌 | 是 对 立 假设 . 
在 检验 一 个 假设 Ho( 对 立 假 设 Hi ) 时 ,我 们 和 希望 犯 两 种 错误 
的 概率 都 尽量 小 .看 表达 式 (1.5) 和 (1.6), 即 得 出 我 们 在 上 段 中 已 
提 到 过 的 结论 , 即 在 选择 一 个 检验 $B 时 ,要 使 其 功效 函数 Bs 在 
H, 上 尽量 小 而 在 Hl 上 尽量 大 .但 这 两 方面 的 要 求 是 矛盾 的 . 正 
好 像 在 区 间 估 计 中 ,你 要 想 增 大 可 靠 性 即 置信 系数 ,就 会 使 区 间 长 
度 变 大 而 降低 精度 ,反之 亦 然 .在 区 间 估 计 理 论 中 ,是 用 “ 保 一 望 
二 "的 原则 解决 了 这 个 问题 ,即使 置信 系数 达到 指定 值 ,在 这 限制 
之 下 使 区 间 精 度 尽 可 能 大 .在 假设 检验 中 也 是 这 样 办 : 先 保 证 第 一 
类 错误 的 概率 不 超过 某 指定 值 a(a 通常 较 小 ,最 条 用 的 是 a 一 
0.05 和 0.01, 有 时 也 用 到 0.001,0.10, 以 至 0.20 等 值 ), 再 在 这 
限制 下 ,使 第 二 类 错误 概率 尽 可 能 小 . 
定义 1.2 设 @ 是 原 假设 Ho 的 一 个 检验 ,Bp(01,…,%) 为 其 
功效 困 数 ,ea 为 币 数 ,0 委 c 委 1. 如 林 
BC0 8) 委 ac ,对 任何 (0 ,0 ) € Ho (1.7) 
则 称 @ 为 Ho 的 一 个 水 平 a 的 检验 ,或 者 说 ,检验 $B 的 水 平 为 a， 
检验 画 有 水 平 a. 
显然 , 若 a 为 @ 的 水 平 而 cil>a, 则 wj 也 是 检验 的 水 平 .这 
样 ,一 检验 的 水 平 并 不 唯一 .为 殉 服 这 点 不 方便 之 处 ,通常 只 要 可 
能 ,就 取 最 小 可 能 的 水 平 作为 检验 的 水 平 . 不 少 著作 中 就 直接 把 
水 平定 义 为 满足 (1.7) 式 的 最 小 的 a .这样 做 ,唯一 性 的 问题 解决 
了 ,固然 是 好 ,但 也 有 其 不 便 之 处 , 即 有 时 我 们 只 知道 (1.7) 成 立 ， 
而 无 法 证 明 a 已 达到 最 小 ,这 时 就 不 能 称 a 为 甸 的 水 平 ,不 好 如 
何 称 呼 .因此 ,我 们 维持 定义 1.2, 但 有 这 样 一 个 默契 :只 要 可 能 ， 
量 找 最 小 的 a. : 


(1.5) 


(1.6) 
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以 上 所 说 的 叫做 “固定 (或 限制 ) 第 一 类 错误 概率 的 原则 ”, 是 
目前 假设 检验 理论 中 一 种 流行 的 做 法 .你 可 以 问 : 为 什么 不 固定 第 
一 类 错误 概率 而 在 这 个 前 提 下 尽量 减 小 第 一 类 错误 的 概率 ”回答 
是 :你 这 么 做 并 非 不 可 以 ,但 是 ,大 家 约定 统一 在 一 个 原则 下 ,讨论 
问题 比较 方便 些 ,这 还 不 是 主要 理由 .从 实用 的 观点 看 ,确实 ,在 多 
数 假设 检验 问题 中 ,第 一 类 错误 被 认为 更 有 害 , 更 需要 控制 .这 - 
点 将 结合 下 一 节 中 实例 的 讨论 再 作 说 明 . 也 有 些 情况 ,确实 第 “类 
错误 的 为 害 更 大 ,这 时 有 必要 控制 这 个 概率 , 换 句 话说 ,控制 第 一 
类 错误 概率 "的 原则 也 并 非 绝对 的 ,可 视 情况 的 需要 而 变通 之 . 


5.1.4 一 致 最 优 检验 


定义 1.3 沿用 定义 1.2 的 记号 . 设 @B 为 一 个 水 平 a 的 检验 ， 
即 满足 41.7). 丰 对 任何 其 他 一 个 水 平 a 的 检验 g, 必 有 

B,(01,…, 0) > B.(01,…, 0), 导 任何 (01,…, 0;) 和 HI 

: (1.8) 

这 里 互 ! 为 对 立 假 设 . 则 称 @ 是 假设 检验 问题 Ho: 旦 | 的 一 个 水 平 
a 的 一 致 最 优 检 验 . 

简单 地 说 ,水 平 a 一 臻 最 优 检验 ， 
就 是 在 一 切 水 平 a 的 检验 中 ,其 功效 
函数 在 对 立 假设 晶 上 处 处 达到 最 大 
者 .或 者 说 ,是 在 一 切 其 第 一 类 错误 概 
率 不 超过 a 的 检验 中 ,第 二 类 错误 概 
率 处 处 达到 最 小 者 . 难 就 难 在 “处 处 ” 
-——- bo,(0) 这 两 个 字 .“ 一 致 最 优 ” 中 的 “一 致 ”, 就 
是 指 这 个 “处 处 "而 言 .就 拿 两 个 检验 
2i 和 更; 的 比较 来 谈 . 为 清楚 计 , 不 
妨 设 原 假设 Ho 为 6 委 1 ,对 立 假设 昌 | 为 6>1. 设 @ 和 GB, 都 是 
水 平 a 的 检验 ,其 功效 函数 分 别 如 图 5.1 中 的 实 线 和 虚线 所 示 . 
在 对 立 假设 0, 处 ,Bs 大 于 Bz,. 而 在 0, 处 则 是 Bo 大 于 Bs . 故 在 
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这 两 个 检验 Gil , B, 中 ,没有 一 个 在 对 立 假 设 各 点 处 处 优 于 另 -- 
个 .由 于 水 平 a 的 检验 非常 多 ,其 中 能 有 一 个 一 致 最 优 者 ,就 不 是 
常见 的 情况 而 是 较 少 有 的 例外 ,更 确定 地 说 ,只 在 总 体 分 布 只 依赖 
一 个 参数 9, 而 原 假设 Ho 是 6 委 00 或 Ho 是 6 三 0 的 情形 , 且 对 
总 体 分 布 的 形式 有 一 定 的 限制 时 ,一 致 最 优 检验 才 存 在 . 其 他 情况 
则 是 稀有 的 例外 .在 下 节 我 们 讨论 一 些 具体 检验 时 ,将 指明 哪些 是 
一 致 最 优 检 验 . 有 的 情况 的 证 明 将 在 本 章 附 录 中 给 出 . 

由 于 一 致 最 优 的 条 件 太 高 ,在 假设 检验 理论 中 也 引入 了 另 一 
些 优良 准则 .这 些 都 超出 了 本 课程 的 范围 之 外 ,不 能 在 此 介绍 了 . 

本 市 所 讲 的 假设 检验 理论 的 基本 概念 ,特别 是 限制 第 一 类 错 
误 概 率 的 原则 及 一 致 最 优 检验 等 ,是 J. 奈 曼 (前 在 区 间 估 计 一 节 
中 已 提 到 ) 和 英国 统计 学 家 下. S. 皮尔 人 进 (K. 皮尔 逊 的 儿子 ) 合 
作 , 自 1928 年 起 开始 引进 的 .基于 这 些 概念 所 发 展 的 假设 检验 理 
论 ,一 般 称 之 为 床 曼 -皮尔 逊 理 论 . 从 统计 学 的 历史 看 ,最 早 引进 假 
议 检 验 并 对 之 作 了 重要 贡献 的 统计 学 家 ,还 要 算 我 们 以 前 多 次 提 
到 过 的 KK. 皮尔 逊 和 R. A. 费 歇 和 尔 . 皮 尔 逊 的 工作 将 在 本 章 5.3 


市 中 介绍 . 
5.2 重要 参数 检验 


本 节 中 我 们 将 讨论 几 个 常用 的 检验 . 构造 检验 ,也 有 些 带 一 般 
性 的 方法 .但 这 些 方法 应 用 上 比较 成 功 的 情况 ,很 大 一 部 分 也 就 是 
本 节 要 讲 到 的 几 个 常用 例子 .所 以 ,我 们 不 采取 从 介绍 这 种 一 般 方 
法 出 发 再 回 到 具体 例子 的 讲法 ,而 在 每 一 个 具体 问题 中 , 从 直观 想 
法 出 发 去 构造 看 来 是 合理 的 检验 . 

这 种 直观 方法 是 基于 参数 的 点 估计 .原则 上 很 简单 :考虑 一 个 
单 参数 的 情形 . 设 被 检验 的 原 假设 是 Ho:0= 06, 或 9 声 0 ,或 6 宇 
90. 有 了 样本 以 后 , 先 找 96 的 一 适当 的 点 估计 TT. 如 果 96= 6 成 立 . 
则 了 与 0 相去 不 应 太 远 , 故 直观 上 看 ,应 当 在 | 工 - 80| > 某 常 数 C 时 ， 
否定 Ho, 而 在 | 本 -00| 志 C 时 接受 (也 可 以 两 边 不 对 称 , 故 一 般 也 可 
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以 :在 CI 委 T 委 C2 时 接受 Ho ,不 然 就 否定 Ho). 如 果 要 检验 的 原 假 
设 是 0 二名, 则 应 当 在 人 >C 时 否定 Ho, 这 看 起 来 很 简单 .但 问题 
在 于 ,我 们 对 检验 有 一 定 的 水 平 要 求 , 上 述 简单 处 理 有 时 无 法 满足 
这 一 要 求 , 而 需要 在 上 述 基 础 上 作 一 些 修 改 .这 就 没有 定 规 了 .从 
以 下 实例 的 讨论 中 ,读者 会 能 悟 出 这 里 面 的 问题 所 在 . 

本 节 的 为 一 个 任务 是 通过 这 些 例子 的 解说 ,加 深 对 上 节 所 述 
一 般 概 念 的 理解 ,并 盖 明 者 干 在 前 节 没 有 深入 发 挥 的 论点 . 


5.2.1 正 态 总 体 均值 的 检验 


设 X1,…,X, 是 自 正 态 总 体 N(0,o2) 中 抽出 的 样本 ,我 们 来 
讨论 有 关 均 值 9 的 假设 检验 问题 . 在 应 用 上 常见 到 的 形式 有 (0。 
是 一 给 定 的 数 ): z 

1” Ho:0>00 ,Hi:0< 0, 

2 Ho:0<00,H1:0> 00 

3” Ho6o:0=0%,H'1:08#0% 

Ho, Ho 和 Hi 为 原 假设 ,Hi,H',H’ 为 对 立 假设 . 以 后 都 按 这 次 
序 : 原 假设 在 前 . 

分 两 种 情况 讨论 

1. 方差 co 已 知 时 

先 考 虑 检验 问题 1". 以 X 记 样 本 均值 ,X 是 9 的 估计 . 故 久 
愈 大 ,直观 上 看 与 原 假设 Ho 愈 符合 .反之 ,X 愈 小 , 则 与 对 立 假设 
忆 | 愈 符合 .由 此 得 出 一 个 直观 上 合理 的 检验 @ 是 

$B: 当 久 之 C 时 接受 原 假设 Ho, 久 < 之 C 时 否定 H。(2.1) 
要 定 出 常数 C, 使 检验 有 给 定 水 平 a, 为 此 要 考虑 更 的 功效 函数 
Bs(0). 按 定义 (1.1), 有 

By(0) = P(X < OC) 
=P(Vn(X -0)/0 < Vn(C—0)/0) 
当 总 体 有 正 态 分 布 N(9,o?) 时 ,Vn(X--09)/o 服从 标准 正 态 分 布 
N(0,1). 以 @ 记 其 分 布 函 数 , 有 
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Bs(0) = B(Vn(C— 0/0) (2.2) 
当 8 增加 时 ,Yn(C 一 9)/o 下降 , 故 Bp(9) 也 下 降 , 这 样 一 来 ,要 
使 Bg(9) 志 (a 当 9 宇 06 时 ) 只 要 Bs(96) = a 即 可 . 按 记 号 ve 的 定 
义 ( 见 第 四 章 (4.3) 式 ), 应 取 C 满足 Yn(C-00)/o=ui_s。= 一 wu， 
由 此 得 
= 0 — gus/Vn (2.3) 
(2.1) 和 (2.3) 结 合 决定 了 检验 ®, 以 C 代入 (2.2), 得 到 更 的 功 
效果 数 为 
Bs(0) = Bl(Vn(bo — 0)/5 ) (2.4) 
当 09< 600 即 属于 对 立 假 设 日 | 时 ,B86(0) 愈 大 愈 好 . 怎样 才能 
使 Bp(40) 大 呢 ” 从 公式 (2.4) 分 析 , 并 牢记 分 布 函数 是 非 降 的 , 易 
得 出 以 下 几 条 结论 : 
(a)9 愈 小 , Bs (9) 愈 大 .直观 的 解释 是 :9 愈 小 , 则 离 原 假设 
Ho 愈 远 , 愈 吻 和 原 假 设 分 辨 开 , 即 犯错 误 ( 第 二 类 ) 的 概率 应 愈 
小 ,因而 Bp(90) 应 愈 大 . 当 09< 如 但 9 接近 96 时 ,Bp(9) 之 a. 由 于 
a 一 般 是 很 小 的 数 , 这 时 犯 第 二 类 错误 的 概率 1 一 pp(0) 之 1 一 a 
很 接近 1. 
(b) 对 固定 的 0O<b,c 愈 大 ,Bp(0) 愈 小 .直观 的 解释 是 :o 愈 
大 ,表示 误差 的 方差 愈 大 .9 与 的 差别 被 “淹没 "在 误差 中 ,不 易 
被 检 出 ,因而 犯错 误 的 概率 就 大 了 .正如 一 杆 秤 误差 愈 大 , 愈 不 易 
分 别 出 两 件 其 重量 略 有 不 同 的 物件 就 轻 就 重 . 反之,o 愈 小 ,By (90) 
愈 大 ,表示 9 与 0 的 差别 印 易 检 出 . 
(c)a 愈 大 , 则 wu。 愈 小 ,而 Bp (90) 就 愈 大 . 直观 上 的 解释 是 :a 
鳃 大 ,表示 能 容许 的 第 一 类 错误 概率 增 大 ,这 时 ,作为 补偿 ,第 二 类 
错 丛 的 概率 应 有 所 降低 , 即 Bs(9) 应 增加 .这 里 明白 看 出 两 种 错误 
概率 的 矛盾 关系 . 
如 果 我 们 提出 要 求 : 犯 第 二 种 错误 的 概率 要 小 于 指定 的 86> 
0 ,该 怎么 办 ? 这 等 于 要 求 
Bs(0) 宇 1- 8,0< 0 (2.5) 
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但 是 , 当 9<b 但 0 接近 0 时 ,po(00)sa 而 因为 ,8 都 很 小 ,一 
机 有 <1 一 人 这 就 看 出 :要 求 (2.5) 无 法 达到 .我 们 只 能 放松 一 
要 求 对 某 个 指定 的 9,< 00 ,有 
po(0) 三 1-8, 当 0 过 0 (2.6) 
因为 8p(0) 随 98 增加 而 下 降 ( 图 5.2). 
(2.6) 等 价 于 要 求 
Bo(01) 宇 1-B8 (2.7) 
. 按 (2.4) ,此 即 
000 06 GV/ni(W-0)/s -ww)1-8 
或 者 说 v za (896 一 01)/o 一 us 宇 ug, 即 
n>o (us t+ ua) /(00- 0) (2.8) 
就 是 说 ,样本 大 小 至 少 应 达到 (2.8) 右 边 那么 大 .例如 ,车 o?= 
a=f=0.05,00 ~- 01=0.5, 则 
n>(1.96 +1.96)/(0.5)? = 61.4656,n 之 62 
即 样本 大 小 至 少 为 62. (2.6) 式 中 91 的 选择 ,当然 要 看 实际 需要 
而 年. 它 表示 ,只 有 对 91 及 比 91 更 小 的 值 来 说 ,否定 “9 宇 90” 才 是 
要 紧 的 ,(2.8) 式 中 与 o7 成 正比 , 即 当 方差 您 大 时 ,为 达到 一 
定 的 分 辩 率 (在 此 可 以 用 |9o -01| 来 刻画 ), 所 需要 的 样本 数 也 愈 
对 检验 问题 2 ,仿照 上 述 讨 论 ,容易 得 出 基于 检验 统计 量 义 
的 检验 是 
BD : 当 久 之 00+ ou,/Yn 时 接受 Hy:0 过 0,, 
不 然 豆 否定 万 0 (2.9) 


pelO) 


图 5.2 


此 检验 的 水 平 为 a ,功效 函数 为 
Bg(0) = 11- B(Vn(00 — 0)/o + wu,) (2.10) 
右 选 定 91 >00, 而 要 求 8s(9) 宇 1 - 8 当 9 宇 0 , 则 得 最 小 所 需 样 
本 大 小 n 仍 由 (2.8) 式 决定 . 
如 果 样 本 (XI ,…,X,,) 使 得 
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O00 ow/Vn 人 XL + ou/vn (2.11) 
则 按 检验 问题 1 的 提 法 ,应 接受 :0 宇 0, 而 按 2 的 提 法 , 则 应 ， 
接受 Ho:9 二 06. 从 生 理 看 这 有 矛盾 . 其实 ,这 反映 了 统计 推断 的 
一 种 特点 , 它 不 是 按 那 种 “ 非 此 即 彼 "的 逻辑 . 这 类 现象 我 们 以 前 就 
磁 到 过 了 : 作 一 个 参数 9 的 点 估计 , 据 同 一 组 样本 你 可 以 作出 若 
干 不 同 的 个 讨 , 讲 起 来 都 有 其 合理 性 ; 作 区 间 估 计时 ,不 仅 用 不 同 
的 枢 轴 变量 可 导出 不 同 的 估计 ,即使 用 同一 枢 轴 变量 ,界限 可 以 有 
不 同 选择 ,置信 系数 可 以 有 高 低 , 都 可 导致 不 同 的 区 间 ,这 些 我 们 
都 不 认为 有 逆 盾 .此 处 亦 然 ,关键 在 于 原 假设 的 选 定 并 非 任意 ,而 
要 看 问题 中 提 法 上 的 “倾向 性 ”此 语 可 通过 下 面 的 实例 来 解释 . 
假定 某 工 三 生产 的 一 种 产品 ,其 质量 指标 服从 正太 分 布 
Ng,c), 且 假定 o 已 知 .0 为 平均 质量 指标 . 设 9 愈 大 ,质量 愈 
好 ,而 bo 为 达到 优 级 的 界限 . 某 商店 经 常 从 该 厂 进 货 ,商店 提出 的 
条 件 是 按 批 验 收 , 只 有 通过 原 假 设 0 之 b4 的 检验 的 批 才 被 接受 .于 
(1) 从 过 去 较 长 一 段 时 期 的 记录 ,商店 相信 该 厂 产 品质 量 总 
的 说 是 好 的 ,当然 这 不 排斥 偶尔 也 出 现 较 差 的 批 . 于 是 它 同意 把 
9 之 Oo 作为 原 假设 并 选 定 一 个 较 低 的 检验 水 平 a, 例 如 a =0.05 其 
至 a 二 0.01. 这 样 做 对 工厂 有 利 , 因 为 这 保证 了 :优质 的 批 ( 即 9 宇 
00 的 批 ) 只 以 很 低 的 概率 xc 被 拒 收 ,而 非 优质 的 批 仍 能 以 不 很 小 
的 概率 被 接收 .从 商店 的 角度 考虑 ,他 们 也 认为 这 样 做 并 非 不 利 : 
一 则 因为 该 三 产 品质 量 一 贯 表现 好 , 故 检 验 可 放宽 些 , 要 有 很 强 的 
证 据 ( 即 X< bo- cusMz) 才 否定 6 宇 90. 一 则 因为 ,既然 大 多 数 
批 质 量 是 优等 的 , 取 较 小 的 a ,保证 了 这 样 的 批 能 以 很 大 的 机 会 通 
过 检验 ,这 对 商店 有 利 . 又 因为 质量 差 的 批 本 来 就 不 多 ,即使 这 样 
的 批 有 较 大 比例 混 过 检验 ,影响 也 不 大 . 
(2) 反之 , 若 以 往 一 段 时 期 的 记录 表明 ,工厂 产品 质量 并 不 很 
好 ,这 样 ,商店 就 可 能 坚持 以 9 过 96 作为 原 假 设 , 并 选 定 一 较 低 的 
水 平 a. 这 样 做 ,表明 商店 要 求 要 有 较 强 的 证 据 ( 即 X>O4 + 
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Gu, /AY 7) 才能 相信 这 批 产 品质 量 为 优 . 等 于 说 一 个 人 一 向 表现 个 
好 , 则 必须 有 较 显 著 的 好 的 表现 ,才能 相信 他 确 有 进步 .这 样 做 就 
达到 了 至 少 把 100(1- a)% 的 非 优 批 拒 之 门 外 的 目的 . 

由 此 可 见 ( 从 以 商店 为 主动 的 一 方 看 ) ,同一 个 问题 ( 即 0 之 00 
或 否 ?) ,由 于 对 背景 的 了 解 不 同 而 采取 了 不 同 的 态度 ,具体 是 通过 
选择 何者 作为 原 假设 来 体现 .到 这 里 ,也 就 不 难 理解 当 样本 满足 
(2.11) 时 ,两 个 原 假设 Ho 和 日 o 都 能 接受 的 表面 子 古 :你 产品 质 
量 一 贯 很 好 时 ,我 认为 这 样本 尚未 构成 这 批 产 品 非 优 的 有 力 证 据 ; 
你 产品 质量 一 贯 不 好 时 ,我 认为 这 同一 样本 尚未 构成 这 批 产 品 为 
优 的 有 力 证 据 . 出 发 点 不 同 ,并 无 矛盾 可 言 . 

最 后 ,对 于 检验 问题 3*,H6:0= 0o 而 Hi:0 关 ,直观 上 看 合 
理 的 检验 规则 是 ; 当 9 的 估计 值 X 离 06 较 远 时 ,否定 H' ,不 然 就 
接受 昌 %, 即 

8 : 当 |X -6 雪 C 时 接受 万 ,不然 就 否定 有 (2.12) 
选择 C ,使 检验 @ 有 指定 的 水 平 w. 这 等 于 要 求 
1~a=P (IX- 60)|< COC) 


=Po (|Vn(X - 00)/o| SV nc/o) 


=@®@B(VnC/o) - B(- vnC/o) 
=2®B(YnC/o)—1 
即 B(V nC/o)=1 一 a/2, 这 导出 YnC/o = up 或 
C = ou, p/n (2.13) 
(2.12) 与 (2.13) 结 合 ,决定 了 丐 ” 

可 以 证 明 ( 见 附录 A) :检验 更 和 划分 别 是 检验 问题 1 ,2° 的 
水 平 a 的 一 致 最 优 检 验 .而 于 则 不 然 , 它 不 是 检验 问题 3 的 水 平 
a 一 臻 最 优 检验 .更 有 其 者 ,可 以 证 明 : 检 验 问 题 3" 的 一 臻 最 优 检 
验 根本 不 存在 . 直观 上 这 一 点 不 难 解释 :问题 1",2' 是 所 谓 “ 单 侧 ” 
的 , 即 对 立 假设 和 原 假 设 各 据 一 侧 , 这 时 ,检验 法 则 只 须 照 顾 一 头 . 
而 检验 问题 3 是 所 谓 “ 双 侧 ” 的 , 即 对 立 假 设 分 据 原 假设 的 两 边 ， 
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它 迫 使 检验 法 则 采取 一 种 折衷 的 形态 ,这 就 损害 了 其 最 优 性 . 

以 上 我 们 详尽 地 讨论 了 检验 问题 1 一 3 当 方 差 已 知 的 情况 ， 
在 实用 上 方差 一 般 未 知 .我 们 之 所 以 对 这 一 情况 作 仔 细 讨 论 ,是 
为 这 个 场合 足够 简单 ,使 我 们 有 可 能 借 此 对 -- 此 重要 概念 人 | 1 清 
人， 以 便 举 一 及 三 .现在 转 到 第 个 情况 的 讨论 . 

. 方差 o7 未 知 时 

仍 以 间 题 为 例 . 这 时 ,从 原则 上 看 ;制定 检验 B( 见 (2.1) 
式 ) 的 想法 仍 适用 ,但 困难 在 于 :由 (2.3) 所 决定 的 常数 C 依赖 于 
木 放 参数 6 ,无 法 确定 .这 就 需要 在 上 述 想 法 的 基础 上 作 一 定 的 修 
改 ,如 本 节 开 始 处 所 曾 提 到 的 . 

把 由 (2.1) 和 (2.3) 决 定 的 检验 @ 改写 成 等 价 形式 ， 
DB:AVn(X — 00)/o > ru 时 接受 万 ,不然 就 否定 万 ， 
这 里 c 未 知 ,我 们 可 考虑 用 其 估计 值 S 代替 ,其 中 S? = 2 (X; - 
六 )?A(n 一 1) 为 样本 方差 .但 在 用 S 代替 v 后 后 ,分布 也 起 了 变化 

由 正 态 分 布 变 为 自由 度 n~1 的 1 分布 ( 当 60= Oj 时 , 见 第 二 音 
(4. 34) 式 ), 因 而 常数 x。 也 要 相应 改 为 上 1(a). 经 过 这 一 修改 ， 
得 到 检验 : 
DD: 当 Vn(X -00)/S >- tn-1(Q) 时 接受 万 ,不然 就 否定 Hl 
z (2.14) 
其 水 平 为 a. 要 证 明 这 一 点 ,就 得 考虑 检验 y 的 功效 函数 
By(0,0) = Poe,s(Vn(X— 0)/S<- i, 1(a)) (2.15) 
可 以 证 明 : 这 个 函数 只 依赖 于 8= (9 一 0,)/o, 它 是 6 的 下 降 范 
数 , 且 当 SS=0 即 = 00 时 其 值 为 a. 这 最 后 -- 条 容易 证 明 ， 因为 当 
0=00 时 ,统计 量 Vv za(X-b)S 一 局 1 (第 一 章 (4.34) 式 ) ,再 根据 
t,-1 的 密度 消 数 关于 0 对称 及 记号 1,，|(a) 的 意义 , 即 有 
By(00,0) = Pe ,soVn(X- 0)/S >1,1(a)) = 
利用 B,(9,0) 是 6= (69-00)/o 的 下 降 消 数 知 , 当 0>0 时 即 当 
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6>0 时 ,80,c) 委 pb00c)=a ,这 证 明了 检验 y 有 水 平 a. 关 于 
8.(0,c) 只 依赖 于 S 且 是 6 的 下 降 函 数 的 证 明 , 见 附录 B. 
类 似 的 论据 给 出 检验 问题 2 和 3 的 水 平 a 检验 ,分 别 记 为 
和 yy: 
几 : 当 VCX 一 00)/S 之 1(4) 时 接受 HH, 不 然 就 否定 万 
(2.16) 
凡 : 当 | Vn(X 一 00)/S| 忒 i1(a 人 /2) 时 接受 万 1， 
不 然 就 否定 Ho (2.17) 
这 三 个 检验 统称 为 1 检验 " ,是 应 用 上 最 重要 的 检验 之 一 .由 于 c 
未 知 , 这 些 检验 的 性 质 也 就 较为 复杂 .例如 ,不 论 你 怎么 指定 一 个 
0<0o, 无 法 找到 一 个 样本 大 小 了 ,使 当 6 委 0 时 ,检验 y 接受 
Ho:0 之 的 概率 ,不 超过 充分 小 的 8>0( 见 附录 好 ) ,而 在 c 已 知 
时 这 是 可 以 做 到 的 ,又 如 在 c 已 知 时 , 单 侧 检验 BB 和 @' 都 是 一 致 
最 优 的 ,但 o 未 知 时 ,除非 检验 水 平 a 宇 1/2,z 检验 内 和 vw 都 不 是 
一 致 最 优 . 
例 2.1 两 厂 生产 同一 产品 ,其 质量 指标 假定 都 服从 正 态 分 
布 ,标准 规格 为 均值 等 于 120. 现 从 甲 厂 抽 出 5 件 产品 , 测 得 其 指 
标 值 为 
119,120,119.2,119.7,119.6 
从 乙 厂 也 抽出 5 件 产 品 , 测 得 其 指标 值 为 
110.5,106.3,122.2,113.8,117.2 
归根 据 这 些 数 据 去 判断 该 两 厂 产 品 是 否 符 合 预 定 规 格 120. 
这 可 以 提 为 假设 检验 问题 9= 120:0 关 120, 方 差 2 未 知 , 对 
息 广 数据 ,算出 X=119.5,S=0.4, 取 w=0.05, 查 表 得 ，_ (av 
2)=14(0.02$)=2.776. 有 


* 人 ,2.15) 和 (2.16) 称 为 -样本 单 人 出 z 检验 (一 样本 表示 只 有 -一 组 样本 
六 ),(2.17) 称 为 ”一 样本 双 侧 1 检验 ”有 时 也 把 a 已 知 时 的 检验 ,DB 和 B" 称 
检验 ”但 不 如 4 检验 的 各 称 用 得 广 
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nlX- 0 /Ss =vyv51119.5- 120| /0.4 = 2.795 > 2.776 
对 乙 厂 数据 ,算出 X=114,S=6.105 ,而 
vniX-0 /Ss =yvSll4-120| 人 .105 = 2.198 < 2.776 
故 按 0.05 的 水 平 ,结论 是 : 甲 广 产 品 与 规格 不 符 , 但 未 发 现 乙 矿产 
铝 不 符合 规格 的 有 力 证 据 . 

这 个 结论 可 能 使 不 少 人 感到 难以 接受 .因为 甲 广 $ 件 产品 都 
与 标准 值 120 相差 很 少 , 反 倒 认 为 不 合 规格 ;而 乙 厂 $ 件 中 除 一 件 
外 ,都 比 规 格 值 120 低 不 少 ,反倒 认为 可 以 通过 .这 是 为 什么 ? 

我 们 说 ,问题 不 能 这 么 简单 地 看 . 

a. 首 先 ,我 们 注意 到 , 甲 厂 的 S=0.4 远 低 于 乙 厂 的 S= 
6.103, 这 表明 , 甲 三 产品 规格 比 乙 厂 稳 定 得 多 . 

pb. 也 下 因为 申 广 产品 规格 很 齐整 (误差 很 小 ) ,所 以 ,与 标准 值 
120 的 些微 差别 (此 处 X=119.5 比 120 只 差 0.5) 也 被 检 出 来 了 . 
不 能 不 承认 : 申 广 产品 的 平均 规格 ,有 很 大 可 能 略 低 于 标准 值 
120. 好 只 略 低 些 ,也 是 事实 ,不 能 委 之 于 随机 误差 .至 于 这 样 -- 个 
差别 的 实际 重要 性 如 何 , 那 要 另 当 别论 了 ,此 处 只 讲 统计 上 的 显著 
性 一 一 即 差异 不 能 用 随机 误差 解释 .统计 上 显著 的 差异 不 -一 定 有 

c. 乙 上 抽出 的 几 件 产品 的 指标 大 多 远 低 于 标准 值 120, 使 我 
们 很 有 理由 怀疑 ,该 厂 产品 平均 规格 达 不 到 120. 但 是 ,由 于 该 厂 
产品 质量 波动 太 大 ,所 测 得 的 数据 尚 不 能 很 有 把 握 认 为 ,其 平均 规 
格 确 与 120 有 差 此 ,而 非 随机 性 影响 所 致 ,就 是 说 , 现 有 数据 可 能 
”所 以 ,对 乙 厂 我 们 首先 认为 :其 产品 质量 波动 太 大 应 当 改 进 . 
至 于 其 平均 规格 是 否 与 120 有 差距 的 问题 ,可 以 再 补充 一 些 数据 
再 检定 ,最 好 是 先 能 采取 措施 把 方差 缩小 些 再 决定 这 个 问题 ， 


$5.2.2 两 个 正 态 总 体 均值 差 移 检验 


设 入 1 是 从 正 态 总 体 N(0,o*) 中 抽出 的 样本 ， Yi1, 
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…, YY 是 从 正 态 总 体 N(0,c) 中 抽出 的 样本 . 0 ,9: 都 未 知 ,c- 
可 以 是 已 知 或 未 知 .注意 两 总 体 有 同一 方差 c-*. 

给 定常 数 60 ,所 要 考虑 的 检验 问题 是 : 

】 Ho:0 一 0 之 200 万 :0 一 0< ON 

2” 万 0:0 -0 过 00 万 | :01— 0»>0, 

3” 已 0:01-0=0,H:0 一 0 天 0 
在 应 用 上 常见 的 情况 是 e 未 知 ,而 04= 0 

所 有 概念 上 的 讨论 与 前 一 段 没 有 本 质 差 异 . 先 说 c: 已 知 的 情 
形 . 以 X 和 Y 分 别 记 X 样本 和 Y 样本 的 均值 , 则 X- 立 为 0 -0， 
的 估计 .于 是 对 问题 1 而 言 ,一 个 合适 的 检验 是 当 久 -了 宇 C 时 
接受 Ho, 不 然 就 否定 Ho. 如何 根据 给 定 的 检验 水 平 a 去 决定 常数 
C, 其 过 程 与 决定 检验 (2.1) 中 的 C 而 得 到 (2.3) 一 样 . 所 不 同 的 
是 :这 里 义 一 Y 的 方差 是 (1/n +1/m)o, 因 而 相应 地 , (2.3) 式 中 
的 Vn 要 政 为 Vnm/An+m). 这 样 得 到 C = 0 ou 
V 《7 二 4)/nm .如 果 引 进 统 计量 


U=/— (XX-Y- 0)/6 (2.18) 
?7 十 77? 


则 二 的 一 个 水 平 a 检验 为 

8: 当 U 实 一 us 时 接受 Ho, 不 然 就 否定 万 
类 似 地 ,问题 2*,3° 的 水 平 a 检验 为 

8 : 当 U 牵 ws 时 接受 Hy, 不 然 就 否定 H， 

8g : 当 |1U| 过 usp 时 接受 HH ,不然 就 否定 Ho 
对 o* 未 知 的 情况 ,处 理 也 与 前 一 段 一 样 , 即 通 过 样本 对 之 进行 估 
计 , 以 估计 值 代替 o*. 这 里 有 两 组 样本 可 用 于 估计 co ,将 其 综合 ， 
得 出 较 好 的 估计 值 
S = F(X X)? + 2 一 了 7)) 

以 5 代 蔡 U 中 的 a, 得 检验 统计 量 


T=./— (XX-Y- 0)/S (2.19) 


nn 二 mi 
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控 第 章 (4.36) 式 , 当 外 -的 = 罗 有 时, 袜 服 从 且 由 度 为 趟 十 闪 一 2 
的 z 分 布 2 基于 了 ,作出 在 天 未 知 时 ,检验 问题 1 一 -3° 的 
水 平 a 检验 有 ,h 和 有 ,分 则 为 

.全 闻 -14,2(Q) 时 接受 Ho, 个 然后 否定 Ho (2.20) 

:个 二 4w aaa) 时 接 妥 万 0 ,不 然 就 否定 Ho (2.21) 
j : 尖 | 本 才 wy2(Q 人 2) 时 接受 万 0, 不 然 就 否定 Ho 
(2 .22) 

这 一 个 检验 A ,六 ,1 都 称 为 “两 样本 z 检验 ”,h 和 有 是 单 侧 
的 而 1 是 双 侧 的 .它们 都 属于 应 用 上 重要 的 检验 .问题 提 法 中 有 
一 个 不 大 自然 的 条 件 一 一 两 总 体 有 辐 -方差 ,不 作 这 一 假定 就 无 
法 使 用 1 分 布 .这 是 一 个 为 了 迁就 数学 上 的 简单 化 而 对 实用 背景 
有 所 插 失 的 例子 .所 可 的 是 :只 要 两 总 体 方差 之 比 与 1 相差 不 太 
大 , 则 经 验 表明 ,使 用 t 检验 是 可 以 令 人 满意 的 . 

例 2.2 甲乙 两 三 生 产 同 -- 种 产品 ,其 质量 指标 假定 分 别 服 
从 正 态 分 布 N(91,o-) 和 NN(0,,o*). 现 从 该 两 厂 分 别 抽出 车 于 件 
产品 测 得 其 指标 值 : 

四 三:2.74,2.75,2.72,2.69(X,,…, X,) 

:2.75,2.78,2.74,2.76,2.72( YY, , Ys) 

要 通过 这 些 数据 来 检验 这 两 厂 产品 质量 何者 为 优 . 

在 这 种 问题 中 ,你 可 以 用 估计 的 方法 去 处 理 : 甲 厂 样 本 平均 
X=2.72S, 乙 厂 样 本 平均 Y=2.7$, 因 Y>X, 从 所 抽样 本 看 乙 厂 
较 优 .但 这 还 不 其 令 人 信服 ,因为 这 个 差距 也 可 以 是 因为 抽样 的 随 
机 性 而 来 ,不 一 定 反 映 本 质 . 

也 可 以 用 区 间 估 计 的 方法 来 处 理 这 个 问题 ,算出 XYY = 
一 0.025， 


S: [Nx 一 区)?2+ Sy ~ Y)]/A4+5-2) 
i_l j=-1 

=0.00058571, S = 0.0242 
n= 二 4,7m 二 5. 取 置信 系数 0.95, 查 表 得 17(0.025)=2.365. 用 第 四 
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章 (4.6) 式 得 01-02 的 区 间 个 计 为 
— 0.025 + 0.0242 xX2.365v 9/20 = [-0.063,0.013 


9; 和 091<0, 三 种 情况 都 有 可 能 .区 间 整 个 偏向 于 负 轴 一 边 ; 显 示 
情况 略 有 利于 乙 厂 .但 最 大 差距 也 只 达到 0.063. 如果 这 么 大 小 的 


”差距 并 无 实际 重要 性 , 则 可 以 说 ,区 间 估 计 的 结果 显示 了 两 厂 产 品 


的 质量 水 平 大 体 相当 . 

如 果 要 用 假设 检验 来 处 理 这 个 问题 , 则 结果 取决 于 原 假设 的 
提 法 ,而 这 要 参考 问题 的 背景 . 例如 , 行 以 往 的 记录 表明 : 甲 厂 产品 
质量 一 般 或 经 常 优 于 乙 厂 ,现在 我 们 想 通 过 实测 检验 ~- 下 目前 情 
况 如 何 . 这 时 ,我 们 取 五 0:0; 9, 宇 0 为 原 假 设 . 这 个 取 法 , 配 之 以 
较 低 的 检验 水 平 ,保证 了 必须 有 很 强 的 证 据 才能 否定 互 , 一 一 即 改 
变 对 现状 的 看 法 .这 是 因为 ,这 个 现状 , 即 有 FG, 已 经 历 了 一 段 时 期 
的 考验 ,除非 实测 结果 表现 出 很 不 利于 它 , 人 们 还 是 倾向 于 把 数据 
中 表现 出 来 的 不 利于 它 的 差异 委 之 于 随机 性 . 

按 9=0,X-Y=-0.025,S=0.024, 算 出 (2.19) 式 的 统计 
量 了 之 值 为 -1.540. 查 表 得 1z7(0.05) = 1.895. 因 为 -1.540 > 
一 1.895, 按 + 检验 ,应 接受 万, , 基 维 持 “ 申 三 产品 质量 优 于 乙 厂 ” 
的 看 法 .或 者 说 ,实测 数据 没有 提供 改变 这 个 看 法 的 有 力 证 据 ， 

如 果 我 们 一 开始 就 采用 五 0:6; - 0 委 0 作为 原 假设 , 则 所 得 
数据 当然 也 使 它 通 过 .这 种 表面 上 的 矛盾 已 在 前 面 解释 过 了 . 

如 采 我 们 不 涉及 以 往 两 厂 产 品质 量 上 的 表现 ,而 单纯 以 “中 
立 的 态度 来 对 待 这 个 比较 问题 , 则 合适 的 原 假设 是 H%: 0) - 0 
=0, 用 所 得 数据 检验 的 结果 , 仍 接受 总 .这 个 结论 也 与 我 们 上 文 
的 分 析 一 致 . 

我 们 把 上 面 的 问题 的 提 法 作 一 点 变化 , 借 此 解释 -下 显 鞭 性 
和 显著 性 检验 这 两 个 概念 . 

一 工 】 用 一 定 工艺 生产 某 种 产品 有 相当 时 间 . 现 有 人 提出 对 
工 纪 作 些 更 改 以 图 改进 产品 质量 . 设 在 工艺 改变 前 后 产品 质量 指 
标的 分 布 分 别 为 N(01 ,0 ) 和 和 N(9,,o?). 如 果 0 >6) ,就 表示 产 
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品质 量 确 有 改进 . 现 要 通过 试验 来 决定 此 项 工艺 改变 是 否 可 取 . 为 
此 ,抽取 工艺 改变 前 后 的 产品 各 者 于 个 以 测定 其 质量 .以 Xi,… 
和 X， 和 YY 分别 记 工 艺 改变 前 后 的 抽样 测定 数据 . 

即便 不 从 统计 学 方法 的 角度 去 考虑 ,人 们 也 多 半 会 采用 如 下 
的 判 据 :计算 Y 一 六, 只 有 当 YX i 时 , 才 
认为 工艺 改变 后 产品 质量 有 “显著 "提高 因而 值得 采用 . 这 个 界限 
C 可 以 通过 改变 工艺 所 需 费 用 与 所 村 权益 的 分 析 丰 多 定 . 但 这 各 
个 涉及 统计 方法 的 分 析 有 一 点 不 足 之 处 , 即 它 没有 考虑 随机 误差 
的 影响 .采用 假设 检验 的 观点 去 分 析 这 个 问题 ,是 克服 这 一 不 足 之 
处 的 一 个 方法 . 

按 假 设 检验 的 观点 ,我 们 应 当 把 Ho:091 写 9, 取 为 原 假设 .如 
以 前 多 次 讲 过 的 ,这 个 取 法 , 辅 之 以 较 低 的 检验 水 平 a ,保证 了 它 
不 会 轻易 被 否定 ,必须 有 很 强 的 证 据 才 能 使 我 们 接受 “工艺 改变 确 
能 提 启 产品 质量 "的 看 法 . 按 检验 hh( 见 (2.20)), 这 只 有 在 

Y-X> Si oa) Vn + ni) /on (2 .23) 


时 成 立 . 

当 这 种 情况 出 现时 一 一 也 就 是 说 , 原 假设 90, 宇 9, 在 水 平 w 上 
被 否定 时 ,我们 说 了- X 达到 了 “显著 性 ”, 即 差异 如 此 显著 ,以 至 
可 以 个 定 0 之 0 .以 此 之 故 ,这 一 检验 也 就 称 为 “显著 性 检验 ” 

从 统计 学 的 观点 看 ,达到 显著 性 无 非 是 指 :在 给 定 水 平 上 , 差 
异 (Y 一 XX) 已 不 能 仅 由 随机 性 来 解释 ,而 也 有 90; 之 91 的 原因 . 统 
计 上 的 显著 性 不 一 定 意味 着 Y 一 了 很 大 .实际 上 ,由 (2.23) 看 出 . 
在 n,m 很 大 ,或 S 很 小 , 则 Y 一 久 只 须 略 大 于 0 就 可 以 达到 显 
着 性 .由 此 可 见 ,是 否 达到 显著 性 并 非 应 否 采取 某 种 行动 (在 此 为 
修改 工艺 ) 的 唯一 依据 ,还 须 结 合 其 他 方面 的 考虑 ,如 前 面 所 曾 提 
到 的 . 

从 茶 种 意义 上 说 ,任何 一 个 检验 都 可 以 理解 为 显著 性 检验 .但 
显 着 性 检验 这 个 名 词 最 常用 于 有 关 某 种 效应 或 差异 是 否 存 在 的 那 
种 问题 , 且 我 们 主观 上 是 希望 该 效应 存在 的 . 如 在 本 例 中 ,我 们 自 
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然 希望 ,工艺 的 修改 确 有 助 于 产品 质量 的 提高 .这 与 例 2.2 那 种 种 
情况 选择 原 假 设 时 所 依据 的 考虑 不 同 . 在 这 种 情况 ,我们 有 理由 倾 
向 于 相信 和 原 假 设 成 立 . 

所 以 ,你 可 以 简单 地 把 “显著 性 检验 "理解 为 “希望 原 假设 被 否 
定 的 那 种 检验 .显著 性 检验 的 特点 不 在 于 这 检验 自身 ,而 在 于 其 
在 使 用 中 的 含义 如 何 . 


5.2.3 正 态 分 布 方差 的 检验 


包括 一 个 正 态 分 布 方差 的 检验 和 两 个 正 态 分 布 的 方差 之 比 的 
检验 .和 正 态 分 布 均值 的 检验 相 比 ,方差 的 检验 在 应 用 上 较 少 一 
些 , 但 也 有 一 些 应 用 .例如 ,一 种 仪器 或 一 种 测定 方法 的 精度 ( 指 其 
内 在 误差 ,不 是 指 由 于 没有 调 准 而 产生 的 偏离 ) 是 否 达 到 某 种 界 
限 , 当 一 种 产品 的 质量 问题 主要 在 于 波动 太 大 时 ,可 能 需要 检验 方 
差 ; 方 差 比 检验 可 用 于 检验 两 个 方差 相等 的 假定 (如 在 两 样本 : 检 
验 中 ) 是 否 合理 等 . 

先 考 虑 一 个 正 态 总 体 的 情况 . 设 久 |,…,X, 是 从 正 态 总 体 NN 
(90,0”) 中 抽出 的 样本 .o? 未 知 ,9 可 以 已 知 或 未 知 .以 下 只 讨论 0 
未 知 的 情况 (9 已 知 的 情况 读者 自己 给 出 ). 设 ci 为 给 定 的 数 . 可 
以 提出 以 下 几 个 检验 问题 : 

1” Ho:o* 之 of, :co2<ci 

2 Ho:o’S<of, Hi:o’>0¢ 

3 Ho:o’=0f, Hi:o #0$ 


先 考虑 1". 取 的 估计 S2 = > (X; 一 久 )?An -1) .1 的 一 
个 直观 上 合理 的 检验 为 


p: 当 >) (Xi - 久之 C 时 接受 Ho, 不 然 就 否定 Ho 
i=1 


(2.24) 
为 定 出 C, 要 计算 o 的 功效 函数 .以 K,_1(z) 记 自由 度 为 n 一 1 
的 卡 方 分 布 函 数 , 则 按 第 二 章 (4.33), 有 
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B,(0,0) =P, (2 (2 - X) < C) 
一 1 


=P,, (Nx, — X)/o: < C/o ) 
i=1 


= K,-1(C/o’) (2.25) 
注意 8,(0,o) 与 均值 6 无 关 , 且 为 o 的 下 降 函 数 . 故 只 须 找 C ,使 
K ICCAoi)=a. 这 得 出 
C = oO» i1(1—a) (2.26) 
(2.24) 和 (2.26) 结 合 定 出 了 问题 1 的 检验 p. 类 似 地 ,得 出 问题 2 
的 检验 pg 和 问题 3 的 检验 yg ,分 别 为 


9 : 当 X; -又 ) 之 ox23_1(a) 时 接受 H6, 不 然 就 否定 HH。 
(2.27) 

7 当 oBx24(1- 委 )< (Xs -过 61( 生 ) 时 接受 
H% ,不 然 就 否定 万 (2.28) 


例如 ,取样 本 大 小 n = 30,a=0.05. 查 表 得 

X35(0.025) =45.722, x3y(0.05) = 42.557 

x30(0.975) = 16.046 
取水 平 a =0.05 ,检验 po 要 求 在 

S” < oo(42.557) /29 = 1.467ci 
时 ,接受 cci 之 假设 . 就 是 说 ,在 方差 估计 值 S? 大 约 为 03 的 
1.5 倍 时 , 仍 得 接受 方差 ci. 如 果 是 双 侧 检验 wo , 则 差距 更 大 , 它 
要 求 在 
0. 53300 全 < S 过 1.S77ci 
时 接受 Ho:o”= ci. 上 述 不 等 式 之 上 界 约 为 下 界 之 三 倍 ,这 说 明 ， 
直 全 像 30 这 么 大 小 的 样本 ,方差 检验 仍 其 不 可 靠 ( 许 多 远离 cz 之 
值 仍 能 被 接受 为 等 于 ci , 即 犯 第 二 类 错误 的 概率 会 甚大 )， 
现 考 虑 两 个 正 态 总 体 的 情况 , 设 Xi ,…,X, 和 Yi，……,Y， 分 
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别 是 从 正 态 总 体 N(bci) 和 N(0,ci) 中 抽出 的 样本 ,可 提出 以 
下 几 个 检验 问题 : 

1” Hy:o1/o3>a,Hiy:oi/o5< a 

2” Hy:oi?/o3Sa, Hi:of/o3>a 

3” Hi:o?/o7=a, Hi:o1/05#a 
a 为 给 定 的 数 .事实 上 ,2° 可 转化 为 1" ,只 须 掉 换 of 和 03 的 位 置 
即 可 . 故 只 须 考虑 1 和 3". 

考虑 1'. 以 Sf 和 S3 分 别 记 X 样本 和 Y 样本 的 样本 方差 . 则 
S?/S3 为 of/o3 的 一 个 估计 值 . 故 问题 1 的 一 个 直观 上 合理 的 检 
验 为 

y: 当 Sf/S3  C 时 接受 万 ,不然 就 否定 H。 (2.29) 
其 功效 函数 为 
Ps(01,03,01,02) = Po ,ov ,0 (SI1/Ss <C) 


2 
“1 1 O05 
= Py Dali， 3S1/ -S35 < 3C 


=G, 1.m 1(03C/01) 
此 处 G, -1 -1(X) 是 日 由 度 为 (mn 一 1,m 一 1) 的 下 分 布 清 数 ( 见 
第 二 章 (4.35)). 此 函数 是 of/o3 的 下 降 函 数 . 故 只 须 决定 C ,使 
Gn-1,m-1(CAa) 二 a 即 可 .由 此 得 
C= aF, tn i(l -a)= a/F, In1(a) (2.30) 

最 后 一 式 见 第 二 章 习 题 

类 似 地 导出 检验 问题 3 的 一 个 检验 为 : 当 Cl 志 Sf?/S3 志 CC 
时 接受 原 假 设 万 0 ,不 然 就 否定 互 0 ,其 中 

C1 = a/F, ia2),C， = aF,_1m.1(¢ /2) 

a 为 检验 的 水 平 . 


5.2.4 指数 分 布 参数 的 检验 


指数 分 布 的 密度 函数 是 第 二 章 (1.20) 式 ,分 布 函 数 则 是 该 章 
(1.21) 式 . 它 是 一 个 单 参数 分 布 族 一 一 只 包含 一 个 参数 1 . 这 个 分 
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布 的 重要 性 在 于 :如 我 们 曾 指 出 的 , 它 描述 了 在 一 定 条 件 下 元 件 每 
的 寿命 分 布 ,因此 在 可 靠 性 分 析 中 是 -个 基础 性 的 分 布 , 有 不 少 的 
应 用 . 
现 设 Xi ,…,X, 是 从 这 总 体 中 抽出 的 样本 .在 实际 应 用 中 ,这 
可 以 是 nn 个 抽 来 供 试验 的 元 件 , 从 开始 试验 起 到 失效 为 止 ,各 元 
件 经 历 的 时 间 , 要 根据 这 些 数据 检验 以 下 这 些 假 设 (40 给 定 ): 
1 Ho:X 之 A0, Hi:A<A0 
2” Ho:iio0, Hi:A> No 
3” Ho:A=Xh0, Hi:AA 
我 们 已 经 知道 :X 是 1A4 的 无 偏 估计 . 当 Ho 成 立时 ,X 应 倾 
向 于 取 较 小 的 值 .于 是 ,问题 1' 的 一 个 直观 上 合理 的 检验 为 
J: 当 XX 声 C 时 接受 HH, 不 然 就 否定 Ho (2.31) 
这 个 检验 的 功效 函数 不 难 计算 .因为 当 参 数值 为 时 ,有 
2A(X1+ + Xi,) = 2nAX ~ 3,. 
因此 
Bo (A) =P,(X > C) = P,(2nAX > 2naAC) 
=1— K,,(2naAC) (2.32) 
这 里 Kzv(z) 是 x5, 的 分 布 函数 ,B,(4) 为 * 的 下 降 函 数 , 故 为 使 
检验 p 有 指定 的 水 平 ,只 须 取 C ,使 
Bol A0) = 1 K2, (2nA0C) 一 C 
这 导致 2nA0C = xX5,(a), 而 
C = X53 (a)/(2nao) (2.33) 
阁 指 定 MK Mo, 而 要 求 当 ) 委 ;时 ,接受 原 假设 Ho 的 概率 
不 超过 给 定 的 相当 小 的 数 8, 则 由 8,(X) 为 4 的 下 降 函 数 , 知 只 须 
有 B,(41)==1 一 B, 即 
Kaa(x3a(a)A/A0) = B 
利用 此 式 可 用 试 算法 结合 查 六 分 布 表 去 决定 4. 先 取 一 个 试探 性 
的 ?代入 上 了 式 左 边 . 若 计算 结果 小 于 8, 则 ”取得 太 大 . 若 大 于 8， 
则 ?取得 太 小 .经 过 调整 ?之 值 后 再 算 . 
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类 似 地 可 得 到 检验 问题 2 和 3 的 水 平 c 检验 p 和 op : 
0O : 当 x > x3,(1 一 a)/A(2nX0) 时 接受 万 ,不 然 就 否定 五 0 


(2.32 ) 
2 : 当 xs 1 加 $)/ mo) 过 X 牵 (Eg)) 2nA0) 时 接受 
Hoo, 不 然 就 否定 Ho (2.33’) 


可 以 证 明 ( 见 附录 A ):p 和 9 都 是 相应 假设 的 一 致 最 优 检验 ,而 
9 则 不 是 问题 3 没有 一 致 最 优 检 验 . 

我 们 来 看 看 问题 2. 假设 6 可 写 为 

五 6: 无 件 平均 寿命 之 1/A0 

而 检验 w 可 写 为 :“ 当 (1AX)A(1/40) 宇 Xi1, (1 一 a)/2n 时 ,接受 
Ho .这 意思 是 说 :只 要 观察 的 平均 寿命 1/X 不 小 于 设 定 的 平均 
寿命 1/40 的 Xx,(1 一 a)/2n 倍 ,假设 Ho 就 可 以 接受 . 取 a= 
0.05,n = 三 15, 查 表 得 

Xin(1— a)/2n = x30(0.95)/30 = 18.493/30 = 0.6184 
即 , 只 要 观察 到 的 平均 寿命 能 达到 设 定 值 的 约 62% ,就 可 接受 “ 平 
均 寿 命 不 小 于 1/40 的 假设 .这 看 来 不 大 能 为 人 接受 ,其 解释 是 : 
一 则 我 们 选择 了 较 小 的 水 平 a( 要 求 不 轻易 否定 Ho) ,一 则 样本 大 
小 15 太 小 了 些 .对 前 者 , 若 将 a 上 升 为 0.3, 则 相应 的 界限 约 为 17 
A0 的 85% .对 后 者 , 若 仍 维持 a =0.05, 但 取 n=100, 将 得 出 相应 
的 界限 约 为 1/40 的 84% ,这 已 算 比 较 合 理 了 . 

因此 ,在 解释 假设 检验 的 结果 时 , 切 不 能 单纯 只 注意 到 是 接受 
还 是 否定 .接受 是 在 什么 条 件 下 ,否定 又 是 在 什么 情况 下 ,其 含义 
如 何 , 有 哪些 因素 起 作用 ,都 须 进行 估量 ,这 样 才 能 得 出 切合 实际 
的 看 法 . 

截 尾 寿 命 检验 

直接 将 前 述 检 验 用 于 元 件 寿命 检验 ,在 实施 上 有 一 个 不 便 之 
处 ; 拿 n 个 元 件 同 时 开始 使 用 ,到 其 全 部 失效 时 试验 才能 停 住 .这 
n 个 元 件 中 难免 有 少数 几 个 寿命 特长 的 . 这么 一 来 ,就 必须 等 待 很 
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长 的 时 间 才 能 结束 试验 ,为 免除 这 个 不 便 , 在 实际 工作 中 常 采用 所 
记 截 尾 法 .正面 我 位 把 这 个 方法 的 实施 步骤 介绍 -下 ,其 中 涉及 的 
分 布 问 题 就 不 能 在 此 细 讲 了 . 
1. 定数 截 尾 法 
取 7 个 元 件 做 试验 . 定 下 一 个 自然 数 之 1, 试验 进行 到 及 
个 元 件 失 效 时 为 止 .把 到 此 时 为 止 ,全 部 x 个 元 件 的 工作 时 间 加 
起 来 记 为 栈 , 即 
T= Yt +Y,+(n-r)Y, (2 .34) 
这 里 Y| 是 最 先 失 效 的 那个 元 件 的 失效 时 刻 ( 从 时 刻 0 开始 算 
起 ),Y, 为 第 二 失效 的 元 件 的 失效 时 刻 . 以 此 类 推 ,第 rv 个 失效 元 
件 在 时 刻 Y, ,试验 也 就 到 此 为 止 ,余下 尚 有 nn 一 + 个 未 失效 元 件 ， 
它们 已 工作 的 总 时 间 为 (n 一 +)Y,. 这样 得 到 工 的 表达 式 (2.34). 
不 难 理 解 :了 愈 大 ,就 愈 使 我 们 相信 元 件 的 平均 寿命 大 .因此 , 比 
如 说 ,问题 2 的 一 个 合理 检验 为 
y: 当 本 宇 C 时 接受 原 假设 互 0 ,不 然 就 否定 Hi (2.35) 
可 以 证 明 : 当 参 数值 为 4 时 ,24T 一 X3. 由 此 出 发 , 仿 前 面 的 推 
理 , 就 不 难 在 给 定 检 验 水 平 g 之 下 定 出 (2.35) 中 的 C 为 
C = x3,(1 ~ a)/(2X0) 
例如 ,要 检验 某 种 元 件 平均 寿命 不 小 于 5000 小 时 这 个 原 假 
议 . 这 相当 于 问题 2*, 并 且 X40=1/5000. 取 15 个 元 件 做 试验 ,预定 
到 第 5 个 失效 时 ,试验 停止 .于 是 n=15,r=5. 设 前 5 个 失效 元 件 
的 工作 时 间 依 次 是 
800,1200,1500,2000 ,2200( 小 时 ) 
则 了 =800+1200+ 1500+2000+2200+10x2200=27500 w= 
0.05, 查 表 得 
C = Xio(0.95) x 2500 = 3.940 x 2500 = 9850 
因为 27300>9850 ,应 接受 原 假设 A 过 1/5000. 


* 见 本 章 习 题 15 


2. 定时 截 尾 法 
各 定 一 个 时 刻 To, 拿 n 个 元 件 做 试验 ,直到 时 刻 To 为 止 .把 
到 这 时 为 止 全 部 2 个 元 件 的 工作 总 时 间 加 起 来 记 为 了 ,算法 蚌 : 
若 某 个 元 件 在 Tu 之 前 的 某 个 时 刻 上 已 失效 , 则 该 元 件 的 工作 时 
间 为 i. 若 到 To 时 刻 仍 未 失效 , 则 该 元 件 的 工作 时 间 为 To.“ 显 
然 ,平均 寿命 愈 大 , 则 T 愈 倾 向 于 取 较 大 之 值 ,于 是 得 出 检验 ; 
J :当代 * C 时 接受 Hy, 不 然 就 否定 Ho (2.36) 
可 以 证 明 : 近 似 地 有 2X2T”* 一 x 和 +1. 这 里 wx 是 到 时 刻 To 停 试 时 已 
失效 的 元 件 个 数 .由 此 出 发 , 仿 前 面 的 推理 , 即 可 定 出 在 给 定 水 平 
a 时 C 的 近似 值 ( 因 24T ~ x3, 41 只 是 近似 成 立 ), 为 
C = Xiur(l — a)/(240) (2.37) 
例如 , 仍 取 Ao==1/5000,a=0.05, 取 10 个 元 件 做 试验 ,把 To 
定 为 1000. 到 时 刻 To 时 ,已 有 5 个 元 件 失 效 , 时 刻 分 别 为 100， 
150 ,230,500 和 580, 则 
T ~ = 100+150+ 230 + 500+ 580 + 5 x 1000 = 6560 
此 处 x=S, 按 (2.37) ,有 
C = x1i(0.95) x 2500 = 4.575 x 2500 = 11437.5 
因为 6560 达 11437.5, 应 否定 原 假设 Ho. 


5.2.5 二 项 分 布 参数 p 的 检验 


设 某 事件 的 概率 为 p,p 未 知 . 作 ”次 独立 试验 ,每 次 观察 该 
事件 是 否 发 生 . 以 X 记 该 事件 发 生 的 次 数 , 则 X 服从 二 项 分 布 B 
(2 , 坊 ) .要 根据 X 去 检验 以 下 一 些 假 设 : 

1 Ho:ppo, Hi:p>po 
Ho:p 之 po, Hi:p< po 
Ho:p= po, Hi:pF¥po 


人 
3° 


x* 也 可 以 更 一 般 一 些 , 对 参 试 的 n 个 元 件 的 每 一 个 规定 不 赔 的 停 试 时 刻本,,…， 
TT .总 工作 时 间 工 计算 方法 与 上 述 相同 . 
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先 考虑 1". 从 直观 上 看 ,一 个 显然 的 检验 法 为 
0D: 当 X 委 C 时 接受 五 o, 不 然 就 否定 Ho (2.38) 
因 X 只 到 整数 值 , 故 C 可 限于 整数 . 此 检验 的 功效 函数 为 
BA(p)=P,(X>C)=1-P,(X<C) 


-ja .39) 


据 第 二 章 习 题 7,B,(p) 为 2 的 增 函 数 . 故 只 须 取 C, 使 8, (po) = 
a , 则 检验 o 将 有 水 平 a. 这 相当 于 要 选择 整数 C ,使 
2 (jos -po)” =1-—a (2.40) 


胀 烦 的 是 ,不 一 定 正 好 有 一 个 整数 C 使 (2.40) 成 立 . 较 常 见 的 情 
况 是 :存在 这 样 一 个 Co. 使 
Co | Co+tl 本 
> ja 一 go) ‘<1l-a< 2 l jad 一 po)” 
(2.41) 
这 时 ,我 们 只 好 取 C 为 Co 或 Co+1. 当 取 C 为 Co 时 ,相当 于 把 
水 平 ac 升 高 一 些 , 即 允许 犯 第 一 类 错误 的 概率 略 大 一 点 . 当 取 C 


为 Co+1 时 , 则 相当 于 把 水 平 a 降 一 点 ,只 要 7 充分 大 , 则 


bo i(1— po)” co! 


nn 
‘Co+1 
这 一 项 一 般 很 小 ,这 种 修改 也 就 很 小 ,不 会 太 影响 实际 .因为 水 平 
a 取 为 0.05 或 0.01 等 并 无 特殊 含义 ,这 样 的 修改 也 不 产生 原则 
问题 . 

但 是 ,在 ?不 很 大 时 ,有 可 能 (2.41) 的 左右 两 边 都 与 1- w 有 
不 可 忽略 的 距离 ,这 时 如 屈从 一 端 , 则 对 水 平 a 的 修改 太 大 ,可 能 
对 当 事 的 一 方 不 利 .举例 如 下 : 

例 2.3 一 工厂 向 商店 供 货 ,商店 要 求 废品 率 不 超过 p = 
0.05 .经 双方 同意 制定 抽样 方案 :每 批 ( 假 定 批量 很 大 ) 抽 n= 24 
件 ,检查 其 中 废品 个 数 X, 当 X 委 C 时 ,商店 接受 该 批 产品 ,否则 
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就 拒 收 . 双方 约定 检验 水 平 为 K=0.05, 这 意味 着 废品 率 为 0.05 
的 批 ,有 95% 可 通过 检查 ( 若 p<0.05, 通 过 的 比率 当然 比 0.95 
更 高 ). 问 题 是 决定 C, 按 (2.40), 要 找 C 使 


[24 24-i 
1 = > |， j00.05) (0.95) i = 0.95 


查 二 项 分 布 表 ”, 知 
C=2 时 ,1 = 0.884;C = 3 时 ,1 = 0.970 

此 两 值 都 与 约定 的 0.95 有 相当 距离 .车 取 C=2, 对 商店 有 利 ; 取 
C=3 则 对 工厂 有 利 . 

照 数字 看 ,0.97 与 0.95 距离 较 近 , 似 以 把 C 取 为 3 较 合 理 . 
但 如 商店 不 同意 ,一 定 要 坚持 0.95 这 个 数 , 则 只 好 按 如 下 的 方式 
处 理 : 

a. 当 X 委 2 时 接受 产品 (接受 假设 p 志 0.05), 当 X 写 4 时 拒 收 . 
b. 奋 X=3, 则 既 不 完全 接受 也 不 完全 拒绝 ,而 按 一 定 的 概率 接 
党 .接受 的 概率 是 
r = (0.95 ~ 0.884)/(0.97 -0.884) = 0.767 

可 以 这 样 设想 : 拿 一 个 袋子 ,其 中 含 白 球 767 个 , 红 球 233 个 .每 次 
抽样 得 出 X=3 时 , 即 随机 从 袋子 中 抽出 一 个 球 , 如 为 白 球 , 产 品 
通过 :否则 就 拒 收 . 

ab 二 者 结合 就 严格 维持 了 0.05 这 个 约定 的 水 平 .这 样 的 检 
验 叫做 “ 随 宙 化 检验 ”, 因 为 在 b 这 个 步 又 中 ,包含 了 一 个 随机 机 制 
去 决定 原 假 设 是 否 被 接受 .在 所 有 涉及 离散 型 分 布 的 检验 中 , 如 要 
坚持 约定 的 水 平 ,往往 得 通过 这 样 的 随机 化 .但 这 种 做 法 ,一 则 黑 
次 ,二 则 对 实用 工作 者 而 言 往 往 党 得 不 自然 .因此 ,除非 确 有 必要 ， 
实用 上 不 大 采用 .这 里 交代 了 以 后 ,以 下 我 们 就 不 再 提 这 个 问题 . 

继续 把 问题 二 看 成 一 个 产品 抽样 验收 的 问题 ,在 实际 使 用 


* 上 日 前 国内 较 仔细 的 二 项 分 布 表 , 以 及 其 他 几 种 常用 统计 表 , 包 括 正 态 分 布 ,统计 
三 大 分 布 及 波 哇 松 分 布 等 的 表 ,是 由 全 国 统计 方法 应 用 标准 化 技术 委员 会 制定 的 国家 
标准 ,统计 分 布 数值 表 GB4086. 
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中 , 除 规定 po 和 水 平 a 外 ,还 要 指定 一 个 较 po 大 一 些 的 数 旋 ; 及 
充分 小 的 数 8, 并 要 求 检验 能 满足 如 下 的 条 件 :车 p 宇 p1, 则 原 禽 
设 Ho 被 接受 的 概率 不 超过 8. 就 是 说 ,废品 率 不 小 于 pi 的 批 , 只 
有 至 多 1008% 的 批 能 通过 检验 .在 抽样 验收 中 ,一 般 使 用 1 一 p, 
(pj) 而 不 使 用 B,(p).1- Bs(p) 称 为 检验 p 的 操作 特征 消 数 或 
OC 吗 数 , 暂 记 为 L,(p). 有 


[op) = Epp (2.42) 
于 是 所 提 的 要 求 可 综合 ; 
Lo(po)=1-a,Ls(p1)=B (2.43) 


如 图 5.3 所 示 , 为 实现 (2.43), 可 能 试 着 选 一 
个 n, 按 (2.40) 决 定 C. 定 出 C 后 ,把 p= pi LalD) 
代入 (2.42) 算 出 Lp(p1). 若 上 Ls,(p1)<< 8B, 则 
nm 取得 太 大 了 . 符 Ls,(p1)B, 则 n 取得 太 1-a 
小 ,经 调整 4 值 之 后 再 重复 上 述 试 算 . 应 用 
上 ,对 一 些 特定 的 po, pl 和 ,B86 值 ,把 nn 和 
C 的 值 造 了 表 . 

产品 抽样 验收 是 二 项 分 布 参数 问题 的 一 
项 重要 应 用 , 它 已 经 发 展 成 为 数理 统计 学 的 一 个 应 用 分 支 ,刚才 所 
讲 只 是 一 种 最 简单 的 情况 . 实际 应 用 中 ,为 了 对 付 各 种 情况 一 一 例 
如 ,每 批 产 品 个 数 不 大 ,而 需要 用 超 几 何 分 布 代替 二 项 分 布 ;一 次 
完成 抽样 可 能 不 经 济 ,而 可 以 考虑 多 次 完成 ,如 复式 抽样 方案 ( 见 
习题 ) 及 序 贯 抽样 方案 ;产品 也 可 以 不 单纯 只 看 其 是 否 合格 ,而 要 
测定 其 指标 值 (数量 验收 方案 ) ;验收 可 以 是 针对 孤立 的 一 些 批 ,或 
是 连续 性 的 ,因而 可 以 考虑 在 何 时 放宽 或 加 严 检查 ,等 等 . 

检验 问题 2 ,3° 的 处 理 方法 类 似 .给 定 水 平 a ,其 检验 分 别 为 

9 : 当 X 之 C 时 接受 Hoo, 不然 就 否定 HH。 (2.44) 

其 中 C 由 关系 式 


CO PP 1 p 


图 5.3 


/ny . 


i=0 \2 
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确定 . 
9 : 当 Cil 二 XX 二 Cs 时 接受 H0, 不 然 就 否定 H’ (2.45) 


其 中 C1, 人 分 别 由 关系 式 


5S{ jad 一 po ) 天 :~ w72 
(2.46) 


3 人 所 — po)” ‘~ a/2 


i=(» +1 


确定 .可 以 证 明 : po 和 ww 都 是 所 给 水 平 下 的 一 致 最 优 检验 ,而 问题 
3' 没 有 一 致 最 优 检验 . 

符号 检验 

符号 检验 的 原始 形态 如 下 :假定 有 甲 、 乙 两 种 牌号 的 同一 产品 
(例如 两 种 啤酒 ). 为 了 解 大 众 的 反映 如 何 , 挑 选 了 7 个 人 ,每 人 给 
以 甲乙 两 牌号 的 产品 各 一 份 ,请 他 们 使 用 后 作出 评定 ,规定 : 若 你 
认为 甲 优 于 乙 , 则 给 一 个 “+ "号 ;大 认为 乙 优 于 甲 , 则 给 一 个 “一 
号 .以 p 记 “ 认 为 甲 比 乙 优 ”的 人 在 整个 大 众 ( 而 不 止 限于 挑 出 的 
这 x 个人) 中 所 占 比 例 , 若 p=1 久 , 则 甲乙 两 种 牌子 谁 也 不 占 优 
势 .为 检验 是 否 如 此 (检验 原 假设 户 =17Z2), 看 这 个 人 的 回答 中 
正 号 的 个 数 X.X 服从 二 项 分 布 B(n,p). 于 是 可 以 使 用 检验 
(2.45),Ci,C2 由 (2.46) 给 出 ,其 中 如 =12. 若 X<Ci, 则 判 甲 
不 如 乙 . 在 X>C), 则 判 乙 不 如 甲 . 若 Cl 过 XX 二 C,, 则 认为 在 水 平 
a 上 尚 不 足 作 出 判断 一 一 尽管 在 样本 中 十 、- 号 个 数 有 差别 ,但 差 
别 不 够 大 ,还 不 能 认为 它 一 定 不 是 由 抽样 的 随机 性 所 引起 . 

更 进一步 ,在 有 些 场合 下 ,可 以 要 求 参 试 的 人 打分 . 如 定 下 
0 一 100 分 的 范围 ,可 以 要 求 每 个 参 试 者 对 甲乙 两 牌号 的 产品 各 
给 一 个 分 ,如 下 表 前 两 行 所 示 . 


参 试 人 1 2 
XI X, Y Y 

评 分 四 | na 
C Yi Y Y Y, 

甲 一 乙 的 符号 十 一 四 


对 这 批 数据 可 以 考虑 用 上 检验 法 :一 是 把 Xi，…,X 和 YY,…, YY 
分 别 看 作 从 正 态 总 体 NW(9 ,co) 和 N(0 co) 中 抽出 的 样本 ,用 两 
伴 本 检验 (2.22) 去 检验 原 假设 0 = 0,. 这 个 做 法 的 问题 在 于 : 
各 人 品味 和 打分 尺度 不 辐 .品味 较 高 的 人 也 许 倾向 二 把 分 给 得 低 
一 些 , 反 之 则 给 得 高 一 些 . 这 不 仅 会 破坏 正 态 性 ,也 会 使 方差 o7 加 
大 而 降低 检验 的 功效 . 另 一 种 想法 是 取 差 
Li X,Y, = 1,,7 

把 Z|,…,Z, 视 为 取 自 NCp,oi) 的 样本 (yi 作为 6 -6 而 cz 可 视 
为 上 文 的 20“. 或 者 ,根本 不 必 与 上 文 的 09,,0, 和 0 发 生 联 系 ). 而 
用 一 样本 z 检验 (2.17) 去 检验 假设 y=0. 这 个 做 法 部 分 地 弥补 了 
前 一 做 法 的 缺点 ,但 仍 有 其 问题 :各 人 在 差距 如 何以 分 数 反 映 上 尺 
度 也 可 能 不 一 , 同 是 感觉 上 这 一 点 差距 ,有 人 觉得 用 5 分 的 相差 就 
够 了 .而 有 人 可 能 愿意 用 20 分 .这 也 会 破坏 上 文正 态 性 假设 和 使 
方差 ct 增 大 . 

现在 看 表 上 最 后 一 行 : Xi 一 六 的 符号 . 这 就 免除 了 前 面 所 讲 
的 可 能 的 缺点 ,因为 此 处 只 要 一 个 好 坏 对 比 的 意见 ,而 不 问 具体 程 
度 如 何 , 这 样 就 回 到 了 符号 检验 . 

当然 ,得 号 检验 也 有 其 缺点 , 即 它 丢 兴 了 X;, Y, 这 些 数据 中 
相当 部 分 的 信息 ,如 果 有 把 握 认 为 参 试 人 给 分 的 尺度 并 无 重大 差 
别 , 用 1 检验 比 用 符号 检验 很 可 能 给 出 更 高 的 分 辩 率 . 因此 ,要 不 
楼 把 分 数 转化 为 符号 ,这 是 一 个 要 依据 对 实际 背景 的 了 解 去 考虑 
的 问题 . 

在 符 导 检验 中 ,我们 对 样本 X ,YY 所 来 自 的 总 体 的 分 布 ,不 
震 有 什么 特殊 的 假定 .这 样 的 检验 在 数理 统计 学 上 称 为 “ 非 参数 检 
验 , 意 即 它 不 是 只 适用 于 某 种 特定 的 参数 分 布 族 ,如 正 态 分 布 族 
或 指数 分 布 族 之 类 . 非 参 数 方法 是 数量 统计 学 中 的 一 个 重要 分 支 . 

顺便 说 一 句 : 符 号 检验 中 那 种 问答 问题 的 方式 ,是 在 民意 测验 
中 对 某 问题 作 二 者 取 一 的 回答 的 那 种 方式 (你 是 否 鞠 同 某 项 措施 ， 
两 位 候选 人 中 你 打算 投 谁 的 票 之 类 ) .在 西方 每 值 大 选 或 总 统 选举 
之 前 ,进行 多 次 民意 测验 ,每 次 挑选 数 百 至 数 千 (以 至 更 多 ) 的 人 进 
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行 调查 . 历史 证 明 :这 种 调查 与 事后 的 结果 惊人 地 一 致 . 不 懂 统计 
学 的 人 对 此 可 能 觉得 难以 理解 :一 国人 民 多 至 于 万 以 至 以 亿 计 ,为 
什么 区 区 数 于 人 的 意见 与 全 体 的 意见 相距 如 此 之 近 , 其 实 不 难 解 
释 . 以 2 计 调 查 人 数 ,nm 记 某 种 特定 回答 (如 准备 投 A 的 票 ) 的 人 
数 , 以 /An 二 估计 pp., 因 其 大 ,可 以 用 第 四 章 (4.13) 式 作 p 的 


区 间 鸽 计 , 它 大 体 上 就 是 + pp BU 一 户 )/An. 如 取 7 三 2500， 
a 二 0.05, 则 


way BO- $B)/n <1.96V 7! - 7 )/2500 


=1.90% 2 2% 
即 用 8$ 鸽 计 p, 大 约 只 有 土 2% 的 误差 .如 果 一 个 候选 人 比 舅 一 个 
岛 完 5 个 百分点 , 则 在 民意 测验 中 就 能 有 确定 的 反映 了 . 


5.2.6 波 哇 松 分 布 参数 1 的 检验 


设 有 一 个 取 非 负 整 数值 的 离散 总 体 , 其 分 布 为 包含 未 知 参 数 
A 的 波 哇 松 分 布 , 如 第 二 章 (1.7) 式 所 示 . 现 设 X 为 抽 自 该 总 体 的 
样本 ,要 考虑 以 下 的 一 些 检验 问题 (40>0 为 给 定常 数 ): 

1 Ho:A<Ah0, Hi:A>No 

2° Ho:2 守 Ao, Hi:4< No 

3 Ho:A=A0, Hi:A= A 

先 考虑 1". 由 于 XX 的 均值 为 4, 当 Ho 成 立时 ,X 倾向 于 取 较 
小 之 值 ,由 此 得 出 下 述 直 观 上 合理 的 检验 : 

2p: 当 X 魏 C 时 接受 万 ,不然 就 否定 Ho (2.47) 

其 功效 函数 为 


(0 
By(4)=1-P(X<C)=1- >eMl (2.48) 
i—0 


* 可 以 一 般 地 设 XX!,…,X, 为 抽 自 该 总 体 中 的 样本 ,但 只 要 取 六 = XI 十 + X，， 
则 据 第 二 章 例 4.3,X 仍 为 波 畦 松 分 布 ,只 参数 改 为 以 ,因此 ,只 抽 .- 个 样本 的 限制 并 
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根据 第 二 章 习 题 10,B,(4) 是 4 的 增加 函数 . 故 为 决定 C 使 检验 9 
有 给 定 的 水 平 w ,只 须 取 C ,使 B,(X0)=a,Bh 


Vad /i =1-a (2.49) 
= 


这 里 也 有 我 们 在 讲 二 项 分 布 参数 的 检验 问题 时 碰 到 的 情况 , 即 不 
一 定 存在 整数 C 使 (2.49) 恰 好 成 立 ,而 是 存在 C0, 使 


CC cntl 


Ze bl <l1l-a< Se oAD/i! (2.50) 
这 时 ， 或 者 调整 a 之 值 ， 让 者 施行 随机 化 ( 当 X=Co+1 时 ), 步 又 


与 以 前 讲 的 相同 . 
适合 条 件 (2.50) 时 Cu 还 可 以 由 等 式 ( 第 二 章 习 题 10) 


Co oo 
eaohb7Lil -| evcld; (2.51) 
二 人 A 


通过 卡 方 分 布 表 得 出 .事实 上 ,在 上 式 右 端的 积分 中 作 变 数 代 换 
上 一 MD ,得 


si e ‘tdt = 5 | e zr dx 
2 40 


一 一 er gx 
20222T( 和 < 十 2 ) 27, 
2 
=1 ~ Ks,.12(240) (2.52) 


此 处 KK， ;，( 工 ) 为 自由 度 2c + 2 的 卡 方 分 布 函 数 . 由 (2.49)， 
(2.51) 和 (2.52), 得 KK; ,3 (2A0)= aw, 即 

240 = Xic+2(1 — a) (2.53) 
然后 查 7 表 用 试探 法 . 先 取 定 一 个 C 值 查 表 得 出 X3acC+2(1 一 a ) . 
若 此 值 小 于 240, 则 表示 C 取得 太 小 ,反之 则 太 大 ,实际 上 ,从 表 上 
“1~-a" 那 一 列 从 上 往 下 看 就 直接 可 以 找到 满足 (2.49) 或 (2.50) 
的 C. 例 如 , 取 A0=1.752,a=0.05, 则 2X40=3.504. 从 xy? 表 中 头 
上 为 1 一 a=0.95 的 那 一 列 往 下 看 , 见 到 

x8(0.95) = 2.733, x10(0.95) = 3.940 
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故 满足 (2.S0) 的 Co 为 Co 二 3. 这 个 方法 的 缺点 是 :人 它 没 有 给 出 
(2.50) 左 . 右 两 端 之 值 . 因 而 在 Co+ 1 处 施行 随机 化 时 的 概率 ( 即 
例 2.3 中 0.767 这 个 数 ) 算 不 出 来 (如 果 所 用 的 六 表 的 表 头 上 人 恰 
有 “2h40 这 一 栏 ,当然 就 不 成 问题 )， 

例 2.4 假定 一 指定 地 区 内 的 人 口中 ,每 年 患 某 种 特 丈 疾病 
的 人 数 服从 波 畦 松 分 布 , 且 过 去 相当 长 一 段 时 间 ,平均 每 年 发 病人 
数 为 2.3 人 .但 近 4 年 内 记录 到 的 发 病人 数 分 别 为 3,4,1,5. 问 是 
否 有 明显 证 据 表 明 发 病 率 上 升 了 ? 

从 数字 上 看 ,发病 率 的 上 升 甚 为 明显 .从 统计 学 的 角度 观察 问 
题 ,就 是 要 检验 一 下 这 表面 上 的 增加 是 否 达 到 了 在 一 定 水 平 u 之 
下 的 显著 性 , 即 不 能 仅 从 偶然 波动 的 角度 去 解释 

为 此 ,以 A 三 2.3 作为 原 假设 ,把 4 个 年 份 的 数字 相 加 ,得 X 
=3+4+1+S=13. 要 注意 和 的 分 布 为 参数 是 41 的 波 哇 松 分 布 ， 
因此 据 X 去 进行 检验 时 , 原 假 设 要 改 为 A 过 X60=4x2.3=9.2. 取 
a 三 0.05. 查 表 有 

X30(0.95) = 18.493 > 240, X38(0.95) = 16.928 < 2 
由 此 知 应 当 在 X 委 13 时 接受 A 世 9.2, 多 写 15 时 否定 (X=14 要 施 
行 随 机 化 ,或 把 14 放 到 和 否定 域内 ). 总 之 , 按 所 得 数据 和 = 13 尚 不 
能 否定 “年 平均 发 病人 数 未 上 升 "之 假设 . 

若 取 a =0.20, 则 查 表 得 

X5(0.80) = 19.820 > 240, X41(0.80) = 18.062 < 2 
相当 于 (2.50) 式 中 的 Co=11, 现 X=13, 该 和 否定 原 假设 和 和 雪 9.2. 

随 着 所 取水 平 a 的 不 同 ,在 同一 数据 下 一 个 假设 的 接受 与 否 
也 可 以 不 同 ,而 水 平 的 选择 是 人 为 的 . 由 此 可 知 ,不 能 把 检验 的 结 
来 按 其 表面 意义 解释 得 太 死 . 拿 本 例 而 言 , 如 果 你 认为 事态 并 非 很 
严重 ,而 采纳 “发 病人 数 增 加 ”的 结论 将 导致 需要 巨额 经 费 的 措施 ， 
你 可 以 慎重 一 些 而 采取 一 个 较 低 的 水 平 ,如 a =0.05. 这 时 你 的 结 
论 契 :目前 尚 无 十 分 有 力 的 证 据 表 明 情 况 已 恶化 了 ,可 再 观察 一 段 
时 间 . 但 如 你 只 是 把 这 个 问题 作为 一 个 单纯 的 科研 题目 ,你 也 许 会 
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倾向 于 认为 不 必 过 于 保守 , 即 宁 取 较 大 一 点 的 水 平 ,例如 a = 

0.20. 这 时 你 的 结论 将 是 :已 有 较 充分 的 证 据 表 明 情 况 有 了 恶化 ， 

值得 注意 ,采取 这 个 看 法 犯错 误 的 机 会 不 超过 0.2. 这 两 种 看 法 并 

无 子 盾 . 怡 恰 相反 ,也 许 这 两 种 看 法 的 结合 ,使 我 们 对 本 题 中 随机 

性 的 影响 如 何 , 得 到 了 更 深入 一 步 的 理解 . 

对 问题 2 和 3, 类似 的 讨论 得 到 水 平 a 的 检验 o 与 og 如 下 : 

P : 当 义 之 C 时 接受 日 0 ,不然 就 否定 Ho (2.54) 

其 中 C 由 关系 式 


C—l 


De oAd/il= a (2.55) 
i1=0 
确定 ,或 用 
2X0 = Xfc(a) (2.56) 
9 : 当 Ci 过 XX 声 C0C; 时 接受 HH ,不然 就 否定 HH (2.57) 
Ci,C» 分 别 由 
CI-1 0, 
De PA/il = a/2, De rai/il=1-a/2 (2.58) 
i=0 i=0 
确定 ,或 用 


240 = Xzc (a/2),2A0 = Xic (1 -a/2) (2.59) 


波 哇 松 分 布 参 数 检验 有 一 个 有 趣 的 应 
用 , 即 用 于 本 节 (5.2.4) 中 讲 过 的 定时 截 尾 
寿命 检验 的 情形 .前 面 我 们 讲 的 定时 截 尾 


是 预定 一 个 时 刻 To ,在 时 刻 0 时 对 7 个 20 To 
元 件 ( 其 寿命 都 服从 参数 为 * 的 指数 分 “元 件 失效 时 刻 
布 ) 进 行 测试 .每 个 参 试 元 件 如 在 时 刻 T。 帮 5 4 


前 失效 , 则 记 下 其 失效 时 刻 而 并 不 替换 该 

元 件 .现在 对 试验 作 一 点 修改 :开始 时 n 个 元 件 参 试 ,不 论 在 T。 

之 前 的 哪个 时 刻 其 中 哪个 元 件 失效 了 ,就 立即 用 一 个 新 的 替换 上 

去 .到 时 刻 To 时 结束 试验 , 把 到 那 时 为 止 失 效 的 元 件 总 数 记 为 

X. 如 图 $.4, 表 示 在 时 刻 0 有 3 个 元 件 参 试 ,到 时 刻 To 结束 , 共 
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有 X=1l 个 元 件 失效 . 

用 第 二 章 习 题 25 容易 推出 :X 服从 参数 y= nToA 的 波 哇 松 
分 布 .如 要 检验 “元 件 平均 寿命 不 小 于 1AA0 好” A ,可 归结 为 
在 波 哇 松 总 体 中 观察 了 XX, 要 检验 假设 “vnToX0 .这 正 是 我 们 
讨论 过 的 问题 . 


5s.2.7 大 样本 检验 


在 上 面 讲 的 一 些 检验 问题 中 ， 我 们 都 知道 了 有 关 检 验 统计 量 
的 确切 分 布 . 据 此 ,就 可 以 在 给 定 的 检验 水 平 a 之 下 ,决定 检验 统 
计量 的 临界 值 , 即 我 们 前 面 多 次 提 到 的 常数 C( 或 C1,C;, 如 在 双 
侧 情 形 ). 

但 在 不 少 问题 中 ,检验 统计 量 在 直观 上 看 合理 ,但 其 确切 分 布 
求 不 出 .这 时 ,往往 就 求助 于 其 极限 分 布 ,依据 它 去 决定 临界 值 C. 
举 -一 个 例子 . 

例 2.5 《〈《 贝 伦 斯 - 费 软 尔 问 题 ) 设 X1,…,X, 和 YI，…，Y， 
分 别 是 抽 自 正 态 总 体 N(01,of) 和 N(0,,o5) 的 样本 .0),o?,0;,o3 
全 都 未 知 ,也 没有 假定 of 与 ci 相等 . 要 检验 原 假设 “0, = 0,”, 对 
立 假 设 是 “9 了 关 9, .也 可 以 考虑 单 侧 的 情形 , 即 "“0 委 0 为 原 假 
设 . 

据 正 态 分 布 的 性 质 有 
X-Y)-(0 -0， 
0 (2.60) 

因为 of ,o5 未 知 , 虽 则 (2.60) 为 确切 分 布 , 仍 无 法 据 以 确定 检验 的 
临界 值 . 于 是 以 X 样本 的 样本 方差 Sf 作为 ci 的 估计 ,以 了 样本 
的 样本 方差 S 作为 3 的 估计 ,分 别 取 代 (2.60) 中 的 有 吧 和 3 得 
到 


(X— Y)-(0— 9,) 
V Si/n + S3/m 
其 确切 分 布 很 复杂 ,但 当 n,m 都 较 大 时 ,其 分 布 接近 N(0,1). 姑 

， 2406 : 


T= (2.61) 


且 认 为 它 就 是 N (0,1), 则 得 到 原 假 设 91 = 9; 的 下 述 检验 法 : 当 
[XYI/V SI/ + SI/m < up (2.62) 


时 接受 原 假设 ,不 然 就 否定 . 

大 样本 检验 ,例如 (2.62) ,在 下 述 意义 下 是 近似 的 :原先 预定 
的 检验 水 平 是 ac ,而 该 检验 的 实际 水 平 与 c 有 差距 .这 是 由 于 
(2.61) 式 的 了 的 分 布 与 N(0,1) 的 分 布 有 距离 .如 果 2 和 都 较 
大 , 则 了 的 分 布 与 N(0,1) 的 差异 就 很 小 ,而 检验 (2.62) 的 实际 水 
平 就 与 其 预定 水 平 a 相差 很 小 . 问题 在 于 ,我 们 一 般 并 不 清楚 对 
一 定 的 nn 入 ,本 的 分 布 与 N(0,1) 的 差异 有 多 大 ,因而 也 就 不 能 
估计 检验 的 实际 水 平 与 其 名 义 水 平 究竟 差 多 少 . 在 区 间 估 计 中 也 
有 这 个 问题 :由 于 使 用 了 有 关 变 量 的 近似 分 布 ,所 作出 的 区 间 估 
计 , 其 实际 置信 系数 与 名 义 (预定 的 ) 置 信和 系数 之 间 , 有 一 个 我 们 不 
了 解 的 差距 . 

因此 ,大 样本 方法 是 一 个 “不 得 已 而 为 之 ”的 办 法 ,只 要 有 基于 
精确 分 布 的 方法 (小 样本 方法 ), 我 们 总 是 乐于 采用 的 ,可 惜 的 是 : 
在 数理 统计 学 的 许多 问题 中 ,能 找 出 形式 足够 简单 旦 便于 使 用 的 
精确 分 布 的 情况 ,到底 还 是 不 多 .因此 ,大 样本 方法 在 数理 统计 学 
中 占有 重要 的 地 位 . 

也 有 的 情况 ,精确 分 布 是 知道 的 ,但 在 样本 大 小 n 太 大 时 , 计 
算 不 便 , 我 们 也 时 常用 其 较 简 单 的 极限 分 布 去 取代 之 .下 面 是 一 个 
例子 . 

例 2.6 再 考虑 5.2.5 段 讨论 过 的 二 项 分 布 参 数 p 的 检验 
问题 ,以 该 处 的 问题 3〈 原 假设 p= po) 为 例 , 前 面 我 们 已 找 出 检 
验 (2.45), 其 中 C1,C; 由 (2.46) 决 定 . 当 n 很 大 时 ,(2.46) 中 的 和 
无 法 从 二 项 分 布 表 上 查 得 ,因而 C1,C; 的 决定 就 不 易 . 

但 根据 中 心 极 根 定理 (第 三 章 定 理 4.3), 当 原 假 设 p = po 成 
立 而 2 一 co 时 ，(X 一 npo)AvV npo(1 一 po) 的 分 布 趋 向 于 N (0， 
1) .近似 地 就 把 N(0,1) 作 为 其 分 布 , 则 可 提出 如 下 的 检验 ; 当 


|(X ~ npo)| /v npo(l — po) 委 usn 
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即 
npo -pv poll— po) XE npot un V poll — po) 
(2.63) 
时 接受 原 假设 p = po, 不 然 叉 拒绝 .与 (2.45) 比 较 , 这 等 于 以 
(2.63) 两 端 之 值 作为 C1 和 C, 的 近似 值 .这 两 个 值 比 C1, C。 的 
确切 值 ( 由 (2.46) 决 定 的 ) 要 容易 计算 得 多 . 

我 们 再 提醒 一 下 以 前 曾 解 释 过 的 一 件 事 和 情 : 统 计 方 法 的 大 小 
样本 之 分 ,不 在 于 样本 大 小 n 多 大 (这 无 清楚 界线 ) ,而 全 看 其 是 
否 使 用 有 关 变 量 的 极限 分 布 . 拿 本 例 而 言 , 若 用 检验 (2.63), 无 论 
2 多 小 ,总 是 大 样本 方法 ; 若 用 检验 (2.,45) 而 Cj,C, 由 (2.46) 决 
定 , 则 无 论 1 多 大 , 仍 是 小 样本 方法 . 


5.2.8 贝 叶 斯 方法 


册 叶 斯 方法 的 一 般 原 则 已 经 在 4.2 节 4.2.4 段 中 阐述 过 ,并 
已 曾 用 于 点 估计 和 区 间 估 计 间 题 . 贝 叶 斯 方法 用 于 检验 问题 至 为 
简单 :如 已 经 选 定 了 先 验 分 布 , 则 在 有 了 样本 Xi,…,X, 后 ,分 别 
算出 原 假设 昌 , 的 条 件 概 率 P(Ho|X1,…,X, ) 和 对 立 假设 HI 的 
条 件 概 率 P(Hi | X1,…,X, ). 车 前 者 大 于 后 者 , 则 接受 原 假设 
Ho; 才 后 者 大 于 前 者 , 则 否定 原 假设 Ho. 如 果 二 者 相等 (都 等 于 17 
2), 则 可 让 其 悬 而 不 决 (留待 进 一 步 考 察 ) ,或 随机 地 取 其 一 ,举例 
说 明之 . 

例 2.7 考虑 第 四 章 例 2.14, 但 此 处 我 们 讨论 有 关 0 的 检验 
问题 . 

1” 设 原 假 设 万 :92 委 0, 对 立 假设 日 | :909>0, 就 该 例 给 的 先 验 
分 布 N(w,a?) ,已 求 出 后 验 分 布 为 正 态 Ni 太 P) ,其 中 六 分别 
见 第 四 章 (2.17) 和 (2.18) 式 . 

当 0 一 六 (5 六 时 ,6 委 0 的 概率 易 算 出 ,此 处 我 们 只 关心 它 
是 否 小 于 12 .显然 , 吉 上 >0, 此 概率 小 于 1 , 若 z<0, 则 大 于 17 
2. 当 1=0 时 则 恰 为 12. 因 此 ,得 出 在 所 给 先 验 分 布 之 下 的 贝 叶 
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斯 检验 为 : 
当 1 之 0 即 久之 -jy/A(no”) 时 接受 Ho:0 志 0 
1 当 上 >0 即 X>-AwxAnaoc) 时 否定 Ho 
( 当 上 =0 即 入 =- wonc2) 时 , 悬 而 不 决 
从 其 中 看 出 先 验 信 息 的 影响 . 设 上 >0, 则 先 验 信息 较 有 利于 Hl: 
0>0. 所 产生 的 后 果 是 :又 必须 小 于 一 个 比 0 更 小 的 数 - pv 
(no*), 才 能 接受 6 委 0, 者 无 这 一 先 验 信息 的 “ 先 人 之 见 , 则 公平 
的 看 法 是 : 当 X<0 时 认为 96 二 0 的 可 能 性 较 大 ,因而 接受 它 . 先 验 
信息 的 存在 使 我 们 要 求 更 强 的 证 据 . 从 其 影响 上 看 ,与 选择 检验 水 
平 a 有 其 相通 之 处 :我 们 愈 是 相信 原 假 设 ,就 愈 是 倾向 于 选择 较 
低 的 a ,而 使 检验 更 有 利于 原 假 设 . 当然 ,这 只 是 一 个 比喻 .在 贝 叶 
斯 方法 中 没有 ”检验 水 平 " 的 概念 , 甚 方法 的 精神 与 这 曼 - 皮 尔 逊 理 
论 根 本 不 同 . 
2” 若 取 原 假设 为 Ho:01 志 9 过 0,(01,0, 给 定 ), 则 原则 上 完 
全 一 样 :在 6 一 NG 人 六) 时 ,算出 0 委 0 委 0 的 概率 为 
(8 二 Koi (一 
| ; )- | - ) 
(2.64) 
我 们 留 给 读者 去 证 明 : 这 图 数 作 为 寺 的 图 数 , 当 上 上 由- ce 升 至 eco 
时 , 先 增 后 减 . 由 此 可 知 , 使 此 表达 式 大 于 1 的 1 是 落 在 某 区 间 
(a ,5) 内 (可 以 是 空 集 ). 相 应 地 ,XX 落 在 某 区 间 (A,B) 内 , 即 贝 叶 
斯 检验 为 : 
| 当 A < 久之 B 时 ,接受 原 假设 Ho:09 志 9 过 09， 
| 大 < 或 了 > 8 时 , 定 H 
| 当 文 = A 或 B 时 ,县 而 不 决 
(2.65) 
用 非 册 叶 斯 方法 , 即 奈 曼 -皮尔 逊 的 方法 ,也 可 以 得 到 形式 一 
样 的 检验 ,但 临界 值 不 同 ,这 留 作 为 一 个 习题 . 
3 最 后 考虑 检验 问题 Hy:06=0,H1:0 关 0. 
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因为 后 验 分 布 为 正 态 ,9 取 一 个 值 0 的 后 验 概率 为 0:P( 
1X1,…,X,) 总 为 0. 故 依 贝 叶 斯 检验 ,不 论 样本 如 何 ,总 要 否定 
Ho,. 

这 样 的 解 看 来 很 不 吸引 人 . 这 里 面 就 有 些 思 想 得 弄 清楚 . 

首先 ,就 贝 叶 斯 方法 而 言 , 它 只 看 后 验 概 率 的 大 小 .0 这 个 值 
的 先 验 概率 为 0, 即 根本 不 可 能 之 事 , 就 是 说 ,先天 地 已 知道 “0= 
0” 不 可 能 ,还 有 什么 值得 去 检验 的 . 

问题 就 出 在 这 个 “绝对 ”上 . 如 果 你 要 检验 某 个 物件 的 重量 “ 绝 
对 地 ”等 于 2.567959 克 , 我 说 你 不 必 检 验 ,世间 找 不 出 其 重量 与 
2.567959 克 一 丝 不 差 的 物体 .在 这 个 意义 上 ,你 可 以 不 经 检验 否 
定 96= 06 这 种 假设 ,可 是 在 实用 中 ,人们 并 不 这 么 绝对 的 看 问题 . 
当 人 们 检验 6= 6 这 假设 时 ,他 是 理解 为 :所 检验 的 其 实 是 :9 在 
90 附近 一 个 可 允许 的 限度 内 , 且 只 要 样本 中 包含 的 证 据 不 与 这 一 
点 相去 太 远 ,就 可 考虑 接受 . 这 是 我 们 日 常 处 理 这 种 问题 的 看 法 . 
我 们 以 前 讲 过 的 ,以 奈 曼 -皮尔 逊 思想 为 基础 的 检验 法 ,很 好 地 体 
现 了 这 一 点 . 

在 此 ,如 一 定 要 用 贝 叶 斯 方法 来 检验 9=0 这 个 假设 ,就 必须 
给 0 这 个 点 以 一 正 的 先 验 概率 po. 剩 下 的 1 po 的 概率 以 某 种 方 
式 分 布 在 6 天 0 的 范围 内 ,例如 按 正 态 分 布 .此 处 不 涉及 细节 ,有 
兴趣 的 读者 可 参看 陈 希 话 . 倪 国 购 合 著 的 《数理 统计 学 教程 >p. 204 
例 5.8. 大 家 可 能 觉得 : po 这 个 值 毫 无 定 准 ,如 何 给 法 ? 在 并 无 确 
实 的 先 验 信 息 可 依 时 ,只 好 赁 考虑 两 类 错误 的 后 果 去 选择 :如 果 你 
认为 错误 地 否定 9=0 后 果 较 严重 ,你 可 以 选择 一 个 略 大 的 po, 以 
使 “9 =0” 难 于 被 否定 一 些 .这 与 在 奈 曼 -皮尔 逊 方 法 中 选择 检验 
水 平 a 有 同一 效应 一 一 须知 ,水 平 a 的 选 定 也 并 无 理论 依据 ,而 
是 基于 实际 考虑 .此 处 po 的 选择 ,不 妨 也 作 如 是 观 . 

贝 叶 斯 方法 的 最 大 的 好 处 是 ;一 经 选 定 了 先 验 分 布 , 则 剩 下 的 
只 是 计算 问题 ,而 没有 找 检 验 统计 量 的 问题 ,特别 是 没有 找 检验 统 
计量 的 精确 分 布 的 问题 ,看 一 个 例子 . 
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例 2.8 设 义 |,…,X, 为 抽 自 正 态 总 体 NC0,c-) 的 样本 ,9 和 

5 都 未 知 ,考虑 检验 问题 
Ho:a ORKb,HI:0<a 或 9>54. (2.66) 
其 中 a ,b 都 是 给 定 的 有 限 和 常数,a <。. 

在 本 节 (5.2.1) 段 中 ,我 们 曾 讨论 过 0 三 90,90 宇 96。 和 0= 00 等 
原 假设 的 检验 问题 ,但 就 是 没有 提 到 过 (2.66), 其 实 这 个 问题 在 应 
用 上 也 有 其 重要 性 .原因 就 在 于 :用 非 贝 叶 斯 的 方法 ,这 个 检验 所 
涉及 的 分 布 问题 不 易 解 决 . 

现 用 贝 叶 斯 法 ,给 9 以 广义 先 验 密度 1 ,给 c 以 广义 先 验 密度 
ao ” ,并 设 二 者 独立 . 这 等 于 说 给 (0,c) 以 广义 先 验 密度 ao-!1, 当 
-co<0<co,co>0. 由 第 四 章 (2.10) 和 (2.11) 式 ,得 知 在 有 了 样 
本 Xi……,X, 时 (0,c) 的 后 验 密 度 为 


Co dexp| ->(X 一 0)? | (~oo<0<%,o>0) 
;1 


(2.67) 


.= (| | 。 -(n+l)e xp| - 2 > (x -02]dbdo) 


C; 是 一 个 与 9,o 无 关 但 与 样本 有 关 的 常数 ,以 下 的 常数 疡 ,下 ， 
等 也 如 此 ,它们 没有 必要 去 计算 .将 (2.67) 对 o 从 0 到 co 积分 ,得 
到 0 的 边缘 后 验 密度 ,为 


(ntl) _ oy py 
cj 。 exp| 27 2 (Xi 9) jac 


这 里 


一 D,( > (X 一 9) )-"? = D,(Si+ n(X— 0)) "2 

= DSo"ll+n(X— 0)°/S8] "2 

= FE,[1l+n(X— 0)/(n 一 1)S2] -2 (2.68) 
其 中 56 为 D(x- 7, 即 (n 一 1)S?,S? 为 样本 方差 . So,S 都 


与 9,9 无 关 . 令 
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0* = Vn(b— X)/S (2.69) 
它 是 9 的 线性 函数 .由 0 有 密度 (2.68), 易 算出 6 有 密度 冰 数 


关 2 
F,(1+ 0 < 一 oo (2 .70) 


7 一 ] 
把 这 个 表达 了 式 和 第 二 章 (4.31) 式 比较 , 即 知 它 是 自由 度 为 六 -1 
的 分布 密度 ,因而 常数 F 就 必然 是 下 {( 夸 )/ (25P( 2 
以 了 ,1 记 上 自由 度 n 一 1 的 1 分 布 函 数 , 用 (2.69),(2.70), 即 得 
P(Ho| Xi1,*…, X,) 一 Pla 去 0 < b |X,,…, X,) 

= P(Yn(a— X)/S<0° SvVn(e - X)/S|X1,, X,) 

Vn(b—X)\ Vn(a — X) 

= TY) ) Ts “ ‘Go ) 


看 它 是 否 大 填 1 人 2, 即 决定 是 否 接受 原 假设 五 ,. 
例如 , 取 原 假设 为 ~- 19 所 1, 样 本 大 小 n=16, 且 设 由 样本 算 
出 X=0.8,S=2. 则 
Vn(b—X)/S =4(1-0.8) 2 =0.4 
Vn(a— X)/S =4(-1-0.8) 人 =-3.6 
因而 

P(-1 委 0 过 1 XXX)= Tis(0.4) ~ T1s(— 3.6) 

查 上 分 布 表 知 上 式 右 边 为 0.621119 - 0.086245 = 0.537874 > 
1/2. 故 应 当 接 受 原 假设 . 

有 意思 的 是 看 (2.69) 式 的 9* , 若 回 到 非 贝 叶 斯 的 看 法 , 即 把 
X,S 看 作 是 随机 的 而 0 为 未 知 常数 , 则 如 第 二 章 (4.34) 所 示 ,0* 
的 分 布 为 自由 度 x 一 1 的: 分布 t_1. 刚 才 我 们 又 证 明了 :在 所 给 
的 (三 义 ) 先 验 密度 之 下 ,9* 的 后 验 分 布 是 上 _| , 殊 途 而 同 归 , 但 解 
释 截 然 不 同 .在 非 贝 叶 斯 意义 下 得 到 的 9* 一 +, _ | 无 助 于 解决 此 处 
的 检验 问题 ,而 在 贝 叶 斯 方法 之 下 ,由 9* 的 后 验 分 布 为 tn_ 1 Bh 
导致 检验 问题 的 解 . 

顺便 交代 一 下 :30 年 代 初 ,R. A. 费 歌 尔 从 非 贝 叶 斯 的 结果 
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Vn(X—0)/S~ i, (2.71) 
出 发 ,用 如 下 的 推理 :在 上 式 中 把 X,S 看 作 已 知 常数 而 将 9 看 成 
是 随机 的 , 则 (2.71) 式 可 看 作 决 定 了 6 的 一 个 分 布 ,他称 之 为 86 的 
信仰 分 布 (fiducial distribution). 其 解释 如 下 :在 抽样 前 ,我 们 对 6 
茫然 无 所 知 . 有 了 样本 后 , 仍 不 能 确切 地 是 出 0. 但 根据 样本 所 提 
供 的 信息 ,我 们 对 6 取 各 种 值 的 “信仰 程度 有 了 不 同 : 例 如 ,我 们 
相信 2 取 X 附近 值 的 程度 , 比 相信 9 取 远 离 X 的 值 的 程度 要 大 
些 . 信 和 仰 分 布 从 数量 上 刻画 了 这 个 相信 程度 .车 以 下 记 6 的 信仰 
分 布 , 则 F(5) 一 F(a) 就 是 我 们 对 “9 落 在 区 间 (a ,2) 内 "的 信仰 
概率 (fiducial probability ). 利用 这 个 就 可 以 进行 统计 推断 作 
区 间 售 计 , 检 验 等 ,这 个 方法 在 数理 统计 学 中 称 为 信仰 推断 法 
(fiducial inference). 

费 软 尔 的 思想 与 贝 叶 斯 学 派 的 基本 思想 有 共同 之 处 , 即 都 是 
把 未 知 参 数 视 为 随机 变量 ,可 以 谈论 其 概率 分 布 .二 者 不 同 之 处 在 
于 贝 叶 斯 学派 要 求 先 验 分 布 而 费 歇 尔 不 要 求 . 贝 叶 斯 方法 中 的 后 
验 分 布 导 费 软 尔 的 信仰 分 布 可 以 作 等 量 观 , 但 是 ,在 贝 叶 斯 方法 
中 ,由 先 验 分 布 到 后 验 分 布 有 一 定 的 规则 遵循 , 即 求 条件 分 布 的 规 
则 .因此 ,一旦 先 验 分 布 指定 了 ,后 验 分 布 并 无 岐 义 . 费 软 尔 的 信仰 
分 布 则 不 然 , 它 虽 不 依赖 什么 先 验 分 布 ,但 不 仅 无 一 定 的 法 则 可 遵 
循 , 且 在 较 复杂 的 场合 ,简直 不 知 从 何 着 手 . 正 是 由 于 这 个 原因 , 信 
仰 推 断 的 方法 没有 能 推 开 来 ,与 频率 学 派 和 贝 叶 斯 学 派 易 足 而 三 . 
但 是 ,这 方法 在 有 些 情况 下 有 其 应 用 ,特别 是 在 我 们 多 次 提 到 过 的 
页 伦 斯 一 费 软 尔 问 题 中 , 此 方法 颇 为 成 功 (参看 前 引 陈 希 双 、 倪 国 
照 书 p. 182 一 183), 目 前 仍 有 些 学 者 对 它 进行 研究 . 

表 回 过 头 说 说 贝 叶 斯 检验 .上 面 提 到 的 那个 准则 , 即 在 P(H。 
| XXX ) >1Z2 时 接受 原 假设 ,并 非 一 成 不 变 的 . 在 实际 问题 
中 ,不 论 接 受 或 是 否定 昌 , ,往往 都 意味 着 一 种 可 能 带 来 经 济 上 或 
其 他 方面 后 果 的 行动 .由 于 后 果 的 严重 性 不 同 及 当事者 的 承受 力 
不 同 , 他 在 作出 决定 时 所 采用 的 “临界 概率 ”就 不 一 定 是 1 人 2, 可 以 
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大 一 些 或 小 一 些 .举例 言 之 :接受 Ho 表示 兴办 某 一 商业 活动 .这 
活动 一 旦 成 功 ,大 有 利 可 图 ,但 也 很 可 能 失败 而 招致 一 定 的 经 济 损 
失 . 一 个 有 实力 能 承担 这 样 的 风险 且 又 富 于 冒险 精神 的 实业 家 ,可 
能 决定 只 要 在 30% 的 成 功 机 会 就 准备 一 试 ,这 时 他 把 接受 Ho 的 
标准 定 为 已 (五 ,| Xi,…,X; ) 宇 0.3. 反 之 ,一 个 实力 不 强 且 较 稳 健 
的 人 ,也 许 会 要 求 有 八成 把 握 才 干 .这 已 不 单纯 是 统计 推断 问题 ， 
而 是 一 种 统计 决策 问题 ,其 特点 是 不 仅 要 考虑 到 样本 提供 的 信息 ， 
还 须 考 虑 到 种 种 决定 可 能 带 来 的 后 果 ”. 


5.3 拟 合 优 度 检 验 


拟 合 优 度 检 验 是 为 检验 观察 到 的 一 批 数据 是 否 与 某 种 理论 分 
布 符合 .例如 ,我 们 考察 某 一 产品 的 质量 指标 而 打算 采用 正 态 分 布 
模型 ,或 考察 一 种 元 件 的 寿命 而 打算 采用 指数 分 布 模型 ,可 能 事先 
有 一 些 理论 或 经 验 上 的 根据 .但 这 究竟 是 否 可 行 ? 有 时 就 需要 通 
过 样本 进行 检验 .例如 ,抽取 若 于 个 产品 测定 其 质量 指标 ,得 X)， 
…, 义 , .然后 依据 它们 以 决定 “总 体 分 布 是 正 态 分 布 " 这 样 的 假设 
能 人 否 被 接受 .又 如 ,有 人 制造 了 一 个 骨 子 ,他 声称 是 均匀 的 , 即 出 现 
各 面 的 概率 都 是 1/6, 是 否 如 此 ? 单 审视 侦 子 外 形 恐 还 不 足以 下 
判断 ,于 是 把 佐 子 投掷 若 于 次 , 记 下 其 出 现 1 点 ,2 点 ,…,6 点 的 次 
数 ,去 检验 这 结果 与 各 面 概率 都 是 146" 的 说 法 能 和 否 符合 . 

拟 合 优 度 检验 在 应 用 上 很 重要 . 除 直 接 用 于 分 布 拟 合 外 , 列 联 
表 ( 见 下 文 5.3.3 段 ) 也 是 一 项 重要 应 用 .另外 ,这 个 问题 在 数理 统 
计 学 发 展 史上 占有 一 定 的 地 位 .其 历史 情况 是 这 样 的 :统计 分 析 方 
法 在 19 捞 纪 时 多 用 于 分 析 生物 数据 , 那 时 曾 流行 一 种 看 法 认为 正 
人 态 分 布 普遍 地 适合 于 这 类 数据 . 到 上 世纪 末 ,K. 皮尔 逊 对 此 提出 
问题 ,他 指出 有 些 数据 有 显著 的 偏 态 ,不 适 于 用 正 态 模型 .他 于 是 


* 关于 统计 推断 与 统计 决策 的 异同 的 论述 ,可 参看 前 面 所 引 陈 希 队 与 倪 国 熙 合 落 
的 书 pp. 222 一 225. 
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提出 了 一 个 包罗 甚 广 的 ,日 后 以 他 的 名 字 命名 的 分 布 族 ,其 中 包含 
正 态 分 布 ,但 也 有 很 多 偏 态 的 .皮尔 逊 认为 :第 一 步 工作 是 根据 数 
据 去 从 这 一 大 族 分 布 中 挑选 一 个 最 能 反映 所 得 数据 性 态 的 分 
布 " .第 二 步 就 是 要 检验 所 得 数据 与 这 个 分 布 的 拟 合 如 何 ,这 一 步 
就 是 似 合 优 度 检验 . 他 为 此 引进 了 著名 的 “ 卡 方 检验 法 "(以 后 写 为 
六 检验 法 ).20 年 代 ,R. A. 费 软 尔 对 xX” 检验 法 作出 了 重要 贡 
献 , 他 纠正 了 皮尔 逊 工作 中 的 一 个 关键 性 的 错误 . 


s.3.1 理论 分 布 完 全 已 知 且 只 取 有 限 个 值 的 情况 


设 有 一 总 体 X. 设 从 某 种 理论 ,或 单纯 作为 一 种 假定 ,认为 X 

的 分 布 为 
Ho:P(X=a)= p,,i = 1,.…,k (3.1) 

其 中 a;,p;,i=1,…,k, 都 为 已 知 , 日 a1,"…,ax 两 两 不 间 , p,; 之 0， 
1 二 1,.…,k. 

现在 从 该 总 体 中 抽样 n 次 ,或 者 说 ,对 XX 进行 2 次 观察 ,得 样 
本 X1,…,X, .要 根据 它们 去 检验 (3.1) 的 原 假设 Hs 是 否 成 立 . 至 
于 为 什么 这 种 检验 称 为 拟 合 优 度 检验 ,将 在 下 文 解释 . 

先 设想 n 足够 大 . 则 按 大 数 定理 , 若 以 vy 记 X| ,…,X, 中 等 于 
ai 的 个 数 , 应 有 vi/An 守 p;,; 即 vv; 之 np;. 我 们 把 np, 称 为 这 个 
“类 "的 理论 值 ,而 把 y, 称 为 其 经 验 值 或 观察 值 .如 下 表 所 示 


显然 , 表 中 最 后 两 行 差 异 愈 小 , 则 Ho 愈 像 是 对 的 ,我们 也 就 愈 乐 
于 楼 受 它 .现在 要 找 出 一 个 适当 的 量 来 反映 这 种 差异 .皮尔 逊 采 用 


* 我 们 在 讲 点 估计 时 提 到 的 “ 矩 估 计 法 ”, 就 是 皮尔 逊 为 这 个 内 的 而 创立 的 .有 趣 的 
征 ,日 前 在 数理 统计 学 中 ,和 邱 法 的 Popularity 反 鲁 超过 了 皮尔 逊 分 布 族 ,这 慌 怕 是 皮尔 
逊 始 料 所 不 及 的 . 
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Z = >)( 理 论 值 - 经 验 值 )*/ 理论 值 

, (3.2) 
一 2 (np 一 yi) /np: 

这 个 量 每 项 的 分 子 部 分 好 解释 ,分 母 用 np; 则 难于 从 直观 上 说 清 

楚 了 , 见 下 文 . 

这 个 统计 量 称 为 皮尔 逊 的 拟 合 优 度 六 统计 量 , 下 文 简称 x“ 
统计 量 . 各 称 的 得 来 是 因为 下 面 这 个 重要 定理 , 它 是 皮尔 逊 在 
1900 年 证 明 的 : 

定理 3.1 如 果 原 假设 Ho 成 立 , 则 在 样本 大 小 n 一 吕 时 ,2Z 
的 分 布 趋 向 于 自由 度 & 一 1 的 x” 分 布 , 即 x%-1. 

这 个 定理 从 理论 上 说 明了 在 Z 的 定义 中 ,分 母 取 为 np; 的 道 
理 : 若 用 别 的 值 ,就 得 不 到 这 人 么 简单 的 极限 分 布 . 

这 个 定理 的 严格 证 明 超 出 了 本 课程 范围 之 外 . 为 使 读者 相信 
其 正确 性 ,我 们 对 &=2 这 个 简单 情况 仔细 考察 一 下 ,在 这 一 情 
况 ,有 


np2 = n(l— pi),vy y= no vl 
于 是 
Z=npi vi) /npit (nnpi-nt+v)/n(l-pi) 
= (vi np) /npi(l— pi1) 
=[(v1 ~ npi)/vV npi(l - pl 
据 中 心 极限 定理 (第 三 章 定 理 4.3), 当 7 >coe 时 ，(7 一 np1)/ 
V npi(1 pi) 的 分 布 收敛 于 标准 正 态 N(0,1). 于 是 2 的 分 布 收 
敛 于 标准 正 态 变量 之 平方 的 分 布 , 按 定义 , 即 yt= xi-i, 因 此 处 
k=2. 
用 这 个 定理 就 可 以 对 Ho 作 检 验 . 显 然 ,应 当 在 Q>C 时 否定 
五 o,Z 和 C 时 接受 Ho.C 的 选取 根据 给 定 的 水 平 c ,看 近似 地 认为 
Z 的 分 布 就 是 x3 1, 则 显然 应 取 C 为 六 1(a). 于 是 得 到 检验 : 
9: 当 Z 志 xi_i(a) 时 接受 Ho, 不 然 就 否定 Ho (3.3) 
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这 是 一 个 “ 非 此 即 彼 "的 解决 方式 ,在 实用 上 ,有 时 采取 一 种 更 
有 弹性 的 看 法 , 它 能 提供 更 多 的 信息 .是 解 短 了 “所 合 优 度 "这 个 名 
词 . 
假定 据 一 组 具体 数据 算出 的 Z 值 为 Zo. 我们 提出 这 样 的 间 
题 : 在 Ho 成立 之 下 ,出 现 像 Zy 这 么 大 的 差异 或 更 大 的 差异 的 可 
能 性 有 多 大 ? 按 定理 3.1, 这 概率 , 暂 记 为 p(2Zo), 近 似 地 为 
p(Z0) = P(Z > 20)| Ho 1 ~ Ki(Zo) 
其 中 Ki _1(X) 为 自由 度 衣 一 1 的 x” 分布 函数 .显然 ,这 个 概率 愈 
大 , 束 说 明 即 使 在 Ho 成 立时 ,出现 Zo 这 么 大 的 差异 就 愈 不 稀奇 ， 
因而 就 愈 使 人 们 相信 Ho 的 正确 性 .以 此 之 故 , 把 p(Zo) 解 释 为 数 
Ee 仑 分 布 (3.1) 的 “ 拟 合 优 度 ”. 拟 合 优 度 愈 大 ,就 表示 数据 与 
论 之 间 的 符合 愈 好 ,该 理论 分 布 也 就 获得 更 充足 的 实验 或 观察 
支持 位 验 (3 3 不 过 电 树立 了 一 个 门槛 a: 当 拟 合 优 度 p(Zo) 低 
于 a 时 , 邯 放弃 Ho.“ 自 然 ,车 取 ac=0.05, 则 当 p(2Z6)=0.06 或 
p(Z0) 二 0.94 时 ,部 接受 Ho. 但 后 者 数据 对 理论 分 布 的 支持 显然 
比 前 者 大 得 多 :前 者 虽 勉 强 过 关 , 但 已 接近 崩 省 的 边缘 . 
例 3.1 “让 而 是 的 入 验 能 子 均 扫 的 问题 ， 它 相 当 于 a, = 
i ,pi 三 1/6,1 二 1,…,6l(a; 的 具体 值 不 重要 , 它 只 是 代表 一 个 类 而 
已 ), 设 作 了 6x 100 次 投 所 得 出 各 点 出 现 的 次 数 为 (理论 值 : 
站 
1=10 一 109,v = 10'° + 1.5x10,ys = 100 -2x106 
v4 =10° +4x10,vs = 100 - 3x10°,v, = 10 + 1072 
(3.4) 


算出 这 组 数据 的 拟 合 优 度 统计 量 Z 之 值 为 


| 这 种 看 法 不 仅 适 合 于 此 处 ,也 适合 于 前 面 所 讲 过 的 那些 检验 问题 .举例 而 言 , 设 
X 是 抽 目 正 态 总 体 Y(0,1) 的 样本 ,要 检验 昌 Hy:0 志 0, 设 x0 是 六 的 具体 值 .可 以 把 P 
(X 宇 x019=0)=1 B(xo) 作 为 ro 这 个 数值 的 拟 合 优 度 . 如 果 zo> ww, 则 拟 合 优 度 
低 于 a 而 否定 Ho. 如果 a 一 0.05, 则 x0 二 2 和 x6 一 100 都 要 否定 FH, 但 后 者 提供 的 否 
定 Ho 的 证 据 , 显 然 比 前 者 有 力 得 多 . 
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Zo =(102 +2.2$SX102+4Xx102+16x10 


+9x108+ 108/4)/10 = 3250 

此 处 上 =6,k 一 1=5. 查 x 分 布 表 ,K;(3250)=0.9999…, 故 拟 合 
优 度 p(Zo) 几 乎 是 0. 这 说 明 , 实 验 数 据 极 不 支持 “ 骨 子 均匀 ”这 个 
假设 . 

这 个 结果 值得 玩味 . 如 拿 数 据 (3.4) 对 p; 作 估 计 , 则 估 出 p， 
的 值 都 在 17M6 土 10… 数 量 级 之 内 .从 实用 的 观点 看 这 丸 怕 可 认为 
是 足够 均匀 了 . 这 种 差异 ,即使 存在 ,也许 并 无 实用 意义 .可 是 ,由 
于 试验 次 数 极 大 ,我 们 达到 了 “明察秋毫 ”的 地 步 , 把 这 么 小 的 差异 
也 检测 出 来 了 .本 例 说 明 :假设 检验 的 结果 的 含义 必须 结合 其 他 方 
面 的 考虑 (样本 大 小 ,估计 值 等 ), 才 能 得 到 更 合理 的 解释 .统计 上 
的 显著 性 并 不 等 于 实用 上 的 重要 性 ,这 一 点 在 前 面 已 提醒 过 了 . 

下 面 举 一 个 反方 向 的 例子 . 

例 3.2 一 家 工厂 分 早 . 中 、 晚 三 班 , 每 班 8 小 时 ,近期 发 生 了 
一 些 事故 , 计 早 班 6 次 ,中 班 3 次 , 晚 班 6 次 . 据 此 怀疑 事故 发 生 率 
与 班次 有 关 ,比方 说 ,中 班 事 故 率 小 些 , 要 用 这 些 数 据 来 检验 一 下 . 

我 们 把 

Ho: 事 故 发 生 率 与 班次 无 关 (3.5) 
作为 原 假设 .如 分 别 以 1,2,3 作为 早 、 中 、 晚 班 的 代号 ,这 个 假设 相 
当 于 (3.1) 中 的 a;=i,p;=1/3,1i 二 1,2,3. 理论 值 为 np,= 15x 
1/3==5. 算 出 Z 之 值 为 
Zo =[(5—-6)°+(5-3)+(5-6)]/sS=1.2 
k 一 1 二 3 一 1=2. 胡 Xo2 分 布 表 ,得 拟 合 优 度 
pl(Z0) = 1— K;»(1.2) = 1—0.451 = 0.549 

故 数据 未 提供 否定 HH 的 证 据 .更 清楚 地 说 ,即使 事故 与 班次 完全 
无 关 , 在 每 一 百 家 工 厂 中 ,你 平均 会 观察 到 SS 家 ,其 各 班次 事故 数 
表面 上 的 差异 甚至 比 这 里 观察 到 的 还 大 .因此 ,表面 上 6:3:6 的 差 
异 其 实 并 不 稀奇 . 

没有 统计 思想 的 人 易 倾 向 于 低估 随机 性 的 影响 .在 此 例 中 ,由 
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于 观察 数 n =15 太 小 ,随机 性 的 影响 就 大 了 .读者 可 计算 一 下 : 若 
观察 的 总 事故 达到 75 而 仍 维持 上 述 比 例 ( 即 早 班 30 次 ,中 班 15 
次 , 晚 班 30 次 ), 则 p(2Zo) 降 至 0.05 以 下 ,因而 有 较 充 分 的 理由 认 
为 三 个 班次 有 差异 了 .在 15 这 么 小 的 观察 数 之 下 ,对 目前 这 个 结 
末 , 只 家 解释 为 :一 方面 数据 未 能 提供 事故 率 与 班次 有 关 的 支持 ， 
一 方面 也 认为 表面 上 的 差异 究 竞 不 宜 完全 忽视 ,值得 进一步 观察 . 


5.3.2 理论 分 布 只 含有 限 个 值 但 不 完全 已 知 的 情况 


先 举 两 个 例子 . 
例 3.3 回 到 "符号 检验 "中 讨论 过 的 那个 问题 . 被 调查 者 对 
后 、 乙 两 牌号 何者 为 优 的 回答 可 能 有 三 种 :1. 甲 优 .2. 乙 优 .3. 认 
为 一 样 或 不 回答 . 所谓“ 甲乙 两 牌号 一 样 ”* 这 时 应 理解 为 ,这 三 种 情 
次 的 概率 依次 为 pi = 0, p> = 0, ps 二 1 ~20, 对 某 个 6 宇 0,0 声 
1/2. 在 这 里 ,理论 分 布 只 是 部 分 已 知 ( 有 上 述 形式 ,特别 是 , 站; = 
p2) ,但 其 中 包含 未 知 参 数 0 ,并 不 完全 知道 . 
例 3.4 想 要 考察 特定 一 群 人 的 收入 与 其 花 在 文化 上 的 支出 
有 无 关系 的 问题 . 把 收入 分 成 高 .中 、 低 三 档 , 文 化 上 的 支出 分 为 
多 . 少 两 档 . 则 每 个 人 可 归 人 六 个 类 别 中 之 一 .分别 以 和 =1 .2， 
…,6 记 ( 高 ,多 ),( 高 , 少 ),…,( 低 , 少 ) 这 56 类 .如 果 这 二 者 独立 ， 
则 应 有 ,例如 
P( 高 ,多 ) = P( 高 )P( 多 ) 
分 别 以 pi1,p2,p3 记 了 P( 高 ),P( 中 ),P( 低 ). 这 三 个 数 就 是 收入 为 
高 .中 、 低 档 者 在 全 体 人 口中 的 比率 , + p+ 轧 3 二 11. 类似 地 以 91 
和 942 分 别 记 P( 多 ),P( 少 ), 有 gi+ gs=1. 这 样 , 若 独 立 性 成 立 ， 
则 X 的 理论 分 布 为 
1 P(X=1)= pig1,P(X = 2) = piq2, P(X = 3) = pg) 
P(X=4)= prq2,P(X = 5) = ps3gq1,P(X = 6) = p39?2 
(3.6) 
这 里 ,我 们 知道 理论 分 布 有 (3.6) 这 种 特殊 形状 ,但 并 不 完全 知道 ， 
因为 其 中 包含 未 知 参 数 p1, ps 和 gl ,其 数目 为 3. 
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这 个 例子 代表 了 一 类 重要 应 用 ,将 在 下 一 段 专 门 讨 论 . 
现在 我 们 可 以 提出 一 般 的 形式 , 设 总 体 X 只 取 有 限 个 值 cl， 
…,as, 其 概率 为 
P(X = a) = p,(0.,,0),7 = 1,.…,k (3.7) 
其 中 0 ,…,0, 为 未 知 参数 ,可 在 一 定 范围 内 变化 .如 在 例 3.4 中 ， 
三 个 参数 p|,p,,gi 的 变化 范围 为 
Pi 守 0,p 宇 0,p1+py 夺 1,0 寺 qi 全 1 
参数 个 数 > 入 & 一 2. 
议 对 X 进行 了 ?2 次 观察 , 仍 如 前 ,以 六 记 X 取 wa; 的 次 数 .所 
要 检验 的 假设 是 
日 0:(3.7) 对 (9091,…,0,) 的 某 一 组 值 (99,…,00) 成 立 (3.8) 
检验 这 个 假设 的 步骤 与 前 面相 似 , 只 多 了 一 个 参数 估计 问题 : 
1 利用 数据 对 参数 0 ,… ,0, 之 值 作 一 估计 ,采用 极 大 似 然 
估计 法 ,即使 ( 略 去 了 与 91,…,9, 无 关 的 因子 n! /vi! …y,1)) 
L = pri(01,°,0)* pr(01,*,0,)' pr (01,.…,0,)) 


y. p;(01,.… ,0,) | 和 
2 pi;(01,%,0,) 30 = 0,7 = 1,,r (3.9) 


此 方程 组 的 解 记 为 2 ,…,0,. 
2” 就 以 (91,…,0,) 作 为 (91,…,9,) 的 真 值 .算出 


p; = pi(01,.%,0,),i = 1,.…,k 

然后 按 公 式 (3.2) 算 出 统计 量 Z 之 值 .有 如 下 的 定理 : 

定理 3.2 在 一 定 的 条 件 下 , 若 原 假设 (3.8) 成 立 , 则 当 样 本 
大 小 n> 吕 时 ,Z 的 分 布 趋 向 于 自由 度 一 1 一 的 yx? 分布 , 即 
Xk- 

这 个 定理 是 费 软 尔 在 1924 年 证 明 的 ,其 确切 条 件 很 复杂 ,不 
在 此 细 述 了 .与 皮尔 避 定 理 3.1 相 比 ,差别 在 于 自由 度 由 一 1 下 
降 为 上 一 1 一 +. 即 ;所 减少 的 自由 度 正 好 等 于 要 估计 的 参数 个 数 . 
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在 这 以 前 ,皮尔 还 曾 认为 这 自由 度 仍 为 一 1. 

3” 据 定理 3.2, 若 以 Zo 记 统计 量 2 的 具体 值 ,算出 Zo 的 拟 
合 优 度 p(2Zo)=1-- Ki 1_,(Z0). 如 给 定 检 验 水 平 a , 则 当 P(Zo) 
<a 时 ( 即 Z0o>xyi 1 (a) 时 ) ,否定 Ho. 

在 这 几 步 中 ,最 麻烦 的 往往 是 解 方程 组 (3.9). 要 计算 p(Z0)， 
得 有 较 细 的 x“ 分 布 表 . 

现在 回 到 例 3.3. 调查 了 ?2 个 人 ,以 和 ys 分别 记 回 答 
“ 围 优 ”,“ 乙 优 ” 和 “认为 一 样 或 不 回答 "的 人 数 . 例 3.3 已 指出 
pi1(0)= pa(9)=0,p3(0)=1 一 20. 由 此 得 出 (3.9) 为 

(y+ y3)/0 -2y3/(1 -20) =0 


其 解 为 9 二 (vi 十 y2)/A2n. 于 是 算出 各 类 的 理论 值 : 


np1(0) 一 (yi 十 > )M2 ,zzpo(0) 二 (yi 十 v3) /2,np3(0) 二 23 
因此 


2 2 
1 十 v2 y] 十 > L1 十 1 十 7 
z= 


2 
= (3.10) 


此 处 有 =3,r 二 1, 上 自由 度 为 & 一 1 一 r= 二 1. 

不 难看 出 ,(3.10) 与 用 以 下 方法 算出 的 Z 一 致 :只 考虑 有 效 
回答 数 N= vj + v;. 把 它 作 为 一 个 ==2. pi == bp; ==1/2 的 假设 去 
检验 .事实 上 , 按 这 个 处 理 法 ,2 值 为 

(v1 一 N/A/2)*/A(N/2)+ (vy 一 N/2)*/A(N/2) = (vi 一 v2 ) AN 
即 (3.10). 按 定理 3.1, 当 原 假设 p1 一 加 =172 成 立时 ,其 极限 分 
布 应 为 x3_1= x?, 与 由 定理 3.2 得 出 的 一 致 , 这 个 特例 说 明了 :在 
有 需要 由 数据 估计 的 参数 时 ,自由 度 确 有 所 降低 . 


5.3.3 对 列 联 表 的 应 用 


列 联 表 是 一 种 按 两 个 属性 作 双 向 分 类 的 表 . 例如 ,一群 人 按 男 
女 ( 属 性 A) 和 有 人 否 色 盲 (属性 B) 分 类 ,目的 是 考察 性 别 对 色盲 有 
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无 影响 .属性 也 可 以 是 在 数量 划分 之 下 形成 的 .如 在 例 3.4 中 属性 
A 一 一 收入 可 按 月 3000 元 以 上 (高 ) 月 1000 一 3000 元 (中 )》、 月 
1000 元 以 下 ( 低 ) 分 为 三 档 , 如 数据 量 大 ,档次 还 可 以 多 分 一 些 . 

表 3.1 显示 一 个 a Xb 双向 列 联 表 .属性 A 有 a 个 水 平 1,2， 
…,a,B 有 5 个 水 平 1,2,…,5b. 随 机 观察 了 个 个 体 ,其 中 属性 
A 处 在 水 平 i, 而 属性 B 处 在 水 平 7 的 个 体 数 ,为 表 中 之 n; .又 


表 3.1 a Xb 列 联 表 


71;. 二 Dn 一 > (3.11) 
分 别 是 属性 A 处 在 水 平 ; 的 个 体 数 和 属性 8 处 在 水 平 ; 的 个 体 
数 . 记 
pi = 了 (属性 A,B 分 别处 在 水 平 i,j) 
问题 是 要 检验 A,B 两 属性 独立 的 假设 日 ). 如 五 , 为 真 ,应 有 
pi = uvwii = 1, a; = 1,.…,b (3.12) 
其 中 
ui 三 P( 属 性 A 有 水 平 i),v; = P( 属 性 B 有 水 平 ;) 
因此 , Ho 之 成 立 , 等 价 于 存在 iu;| , |v;| ,满足 


ui > 0,0u = 1;v >0,2)v=1 (3.13) 
i=1 j=1 
使 (3.12) 式 成 立 . 
在 这 个 模型 中 ,u,v 等 充当 了 参数 91,…, 09, 的 作用 .总 的 独 
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立 参 数 个 数 为 
r=(a-1)+(b-1)=a+t+6b—-2 
为 估计 i; 0;, 写 出 似 然 销 数 


了 on a 四 
L = 1 | Cw) = [| we [wr 
1 一 j= 


取 对 数 


经 


了 
logL = > 72; * logu; + > 7 .log 


i=1 j=1 


注意 独立 参数 为 ul，,"…，,u。- 1 和 v1 ,Vp-]; 而 zs 二] 一 Ul 


Ou Ov, 
7 i , 战 二 二 一 1,i 二 1,*…,a 一], 一 一 一 
1» up 1 bp-1 Ou; Du 
1,7 二 1,…,b 一 1. 由 此 得 方程 
_ OlogL _Ni We ,| ..., 
0 三 Bu i w+ ,Q 一 ] 
_ QiogL _n No _ 
0 = Dv, 一 也 六 ?7 1 0 一 
由 这 方程 组 ,并 利用 (3.13) 以 及 
a b 
> in,. = Dan. 一 7? 
i=1 1=1 
即 得 解 为 
Ui = NANnsi = ,a; v= n,n = 1,%,b 
(3.14) 


其 实 ,估计 量 (3.14) 不 是 别 的 , 正 是 用 频率 估计 概率 .例如 ,nn;. 是 
在 ?2 个 个 体 中 ,属性 A 取水 平 i 的 个 体 数 , 故 n../An 正好 是 频 


率 ” 
wt 


由 估计 量 (3.14) 得 pi = ;2; = Ni 7 .AT2 因而 得 到 第 (i,j) 


x Uj;,; 不 允许 为 0. 实际 上 . 若 某 个 .=0( 因 而 &;=0,) 则 表 3.1 的 第 i 询 全 为 
0. 这 时 A 的 水 平 i 应 当 划 去 .这 当然 不 是 说 A 不 能 有 水 平 i, 只 是 在 样本 中 未 出 现 ,无 


法 讨论 ,只 能 看 作 没有 . 
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格 的 理论 值 为 7 Pi= ni.n.;/n ,因此 统计 量 Z 为 


a b 
ZC= > > (ni 一 Nien /Nn) /ni.n./n) 
i=1 j=1 


局 p 
= >) 2 (ms 一 fi) A nmi.n.)) (3.15) 


自由 度 为 上 -1 rab -1 (rp 2)=(a DT) 

在 <c=0=2 这 个 特例 , 表 3.1 有 时 也 称 为 “四 格 表 ”人 简单 的 
代数 计算 证 明 ,这 时 有 

Z = nnn 一 M12721) /ni.no.n.in.) (3 .16 ) 

目 由 度 为 1 

例 3.5 考虑 例 3.4. 设 随 机 从 某 特 定 一 大 群 人 中 ,调查 了 
201 名 ,结果 如 下 表 . 其 中 A 表 收 入 ,1,2,3 分 别 表示 低 、 中 高 ;B 
表 文 化 支出 ,1,2 分别 表示 “ 少 ”" 和 “多 ”. 


须 分 别 就 每 个 格子 计算 和 (3.15) 中 的 项 .例如 ,第 一 个 格子 为 
(201 x 63 - 79 x 160)*/(201 x 160 x 79) = 0.0002. 

其 他 5 个 格子 之 值 依 次 算出 为 0.8333,0.6367,0.0008,3.2521， 
2.4847. 这 6 个 数 的 和 , 即 统计 量 Z 的 值 2Z0, 为 7.2078, 自 由 度 为 
(3 一 1)(2 一 1)=2. 查 x* 分布 表 ,得 拟 合 优 度 p(26o) =0.0207. 此 
值 很 低 ,说 明 “ 收 入 与 文化 支出 无 关联 "的 假设 极 不 可 能 成 立 .考察 
所 得 数据 ,收入 高 者 文化 支出 偏 低 . 

例 3.6 有 三 个 工厂 生产 同一 种 产品 .产品 分 1,2,3 三 个 等 
级 .为 考察 各 工厂 产品 质量 水 平 是 否 一 致 ,从 这 三 个 工厂 中 分 别 随 
机 地 抽出 产品 109 件 ,100 件 和 91 件 , 每 件 鉴定 其 质量 等 级 ,结果 
如 下 表 . 
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l 

2 28 117 
3 23 18 14 55 
利 109 100 91 300 


“各 工厂 产品 质量 一 致 "这 个 假设 ,可 看 作 是 “工厂 ”和 “质量 等 
级 "这 两 个 属性 独立 的 假设 .用 公式 (3.15) ,算出 统计 量 Z 之 值 
Zo=13.59. 自 由 度 为 (3-1)(3-1)=4. 查 六 分 布 表 , 得 拟 合 优 度 
为 p(Zo)=1 一 Ks4(13.59) 达 0.01, 故 结果 高 度 显 著 , 即 有 明显 证 
据说 明 各 工厂 产品 质量 并 不 一 致 .从 表 上 数据 看 ,1 厂 质量 明显 优 
于 另 两 厂 , 而 2,3 厂 的 差别 似 不 大 ， 

本 例 与 例 3.5 比 有 一 点 不 同 . 在 例 3.5 中 ,每 一 个 体 抽出 后 
才 去 确定 其 两 属性 的 水 平 , 故 表 中 边缘 的 数据 , 即 79,34,68 ,及 
160 ,41 ,都 是 随机 观察 结果 .本 例 则 不 然 . 三 三 各 自 抽样 数 109， 
100 ,91 等 ,在 抽样 前 已 定 下 ,并 非 随 机 ,每 一 个 体 在 被 抽出 时 ,其 
A 属性 的 水 平 事先 已 定 ( 从 第 一 厂 抽 的 产品 ,事先 就 知 其 A 属性 
的 水 平 必 为 1). 哩 有 这 个 差别 ,但 理论 上 可 以 证 明 : 定 理 3.2 仍然 
适用 . 

像 例 3.6 这 种 检验 问题 常 称 为 “ 齐 一 性 检验 ”. 因为 ,本 例 更 自 
然 的 看 法 是 把 三 个 工厂 的 产品 看 成 三 个 分 别 的 总 体 ,每 总 体 依 质 
量 等 级 各 有 其 分 布 ,共有 三 个 分 布 .检验 的 假设 是 “这 三 个 分 布 一 
致 ( 或 齐 一 ). 而 像 例 3.5 那 种 检验 问题 则 称 为 “独立 性 检验 ”, 其 
目的 是 判定 两 个 属性 有 无 关联 存在 . 


5.3.4 总 体 分 布 为 一 般 分 布 的 情形 
这 包括 总 体 分 布 为 离散 型 ,但 能 取 无 限 多 个 值 例 如 波 哇 松 分 
布 的 情形 ,以 及 总 体 分 布 为 连续 型 ,例如 正 态 分 布 的 情形 . 设 X，， 
…,X， 为 自 某 总 体 中 抽出 的 样本 ,要 检验 原 假 设 
Ho: 总 体 分 布 为 F(z) (3.17) 
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其 中 FU(z) 可 以 是 完全 已 知 ,也 可 以 带 有 未 知 参 数 , 这 时 F(x) 成 
为 F(x;01,…,9,). 其 中 (91,…,0,) 可 以 在 一 定 的 范围 内 取 值 ,而 
(3.17) 则 改 为 
Ho: 对 其 一 组 值 (99,… ,00) ,总体 分 布 为 F(x ;907,… ,97) 
(3.18) 
检验 这 一 假设 的 办 法 是 ,通过 区 间 分 划 把 它 转化 为 已 讨论 过 
的 情况 . 为 确定 计 , 设 下 是 连续 型 的 .把 (一 %,%) 分 割 为 一 些 区 
间 
-OO0=a0<al<a "ar 人 Qi= 0 
一 共 上 个 区 辐 :三 一 (ao,alj，…, 开 一 (ai-lyaij 并 一 (ak -1， 
at) .如 果 总 体 的 分 布 为 下 (z3;0 ,9), 则 区 间 无 有 概率 
DO000) = F(ai;01,..,0,) 
— F(a1;01 0) = 1,.…,k (3.19) 
以 v; 记 样本 1 ,…,X, 中 落 在 区 间 工 内 的 个 数 ,i = 1,…,k. 通 过 
这 个 办 法 ,我 们 就 回 到 了 在 5.3.2 段 中 已 讨论 过 的 情况 , 连 记 号 
pi(01,…,0,),v; 也 一 样 .以 下 的 步骤 就 与 那里 讲 的 完全 一 样 , 基 
于 定理 3.2, 拟 合 优 度 统计 量 Z 的 极限 分 布 为 x3 -| ,, 故 分 区 间 
的 数 日 & 不 能 小 于 x +2. 
当然 ,通过 分 区 间 ,我 们 实际 上 是 用 另外 一 个 假设 Ho 代替 了 
原来 的 假设 (3.18) .五 o 是 :对 某 一 组 值 (人 1,…，,60) ,总 体 在 区 间 
关内 的 概率 为 六 (0 ,9 ) ,i 二 1,…,k”. 若 (3.18) 成 立 ,Ho 当 
然 成 立 .反之 ,由 Ho 成 立 推 不 出 (3.18) 成 立 ,因为 Ho 丝毫 没有 
限制 总 体 在 每 个 区 间 I; 内 的 分 布 如 何 .所 以 如 否定 了 五/ , 则 更 有 
理由 否定 所 0. 右 接受 五 0, 则 我 们 也 接受 五 4 这 方法 就 是 如 此 
规定 的 .可 以 设想 , 若 区 间 分 得 很 细 , 则 每 个 小 区 间 I; 内 的 概率 都 
不 大 ,Ho 与 Ho 之 间 也 就 更 接近 ,但 是 ,分 区 间 数 & 取决 于 样本 大 
小 .为 了 使 定理 3.1 或 3.2 中 的 极限 分 布 与 Z 的 确切 分 布 的 差 
距 缩 小 ,就 要 求 分 区 间 数 少 些 ,以 使 每 区 间 内 样本 数目 ( 即 y,) 大 一 
些 , 这 是 两 个 互相 矛盾 的 要 求 , 在 实际 工作 中 ,通常 是 根据 样本 值 
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的 情况 来 划分 区 间 ”" ,以 使 每 个 区 间 内 所 含 样本 数 不 小 于 5, 而 区 
间 数 & 又 不 要 太 大 或 太 小 .一 般 在 40 委 na 委 100 时 ,区 间 数 可 取 为 
6 至 8; 当 100 委 ”< 委 200 时 ,可 取 为 9,…，,12. 当 交 >200 时 可 适当 
增加 ,一 般 以 不 超过 1S 一 20 为 宜 . 这样 划分 时 ,有 时 不 能 照顾 到 各 
区 间 ( 除 互 和 五 外 ) 之 长 相等 . 

对 总 体 为 离散 的 情况 , 设 它 能 取 的 值 按 大 小 排列 为 ay1< av< 
看 样本 XXX 中 有 较 多 个 (例如 至 少 5 个 以 上 ) 取 a; 为 
值 , 则 a; 自 成 一 组 . 若 不 然 , 则 把 相 邻 的 几 个 wa; 并 成 一 组 ,分 组 数 
目的 考虑 与 上 述 相同 . 


这 个 检验 中 最 难 的 一 部 分 就 是 计算 出 91,…,9, 的 估计 值 6 1， 


…,0,. 这 要 通过 解 方 程 组 (3.9), 其 中 p;(01,…,90,) 由 (3.19) 给 
出 .这 种 方程 确切 解 的 计算 很 难 .例如 , 若 要 检验 总 体 分 布 为 正 态 
N(4,0 ), 则 ==2,01 二 ,92 二 =o. 而 : 


pi(1p,0) = 去 so[- 5 人 (z 一 Adz 


要 把 这 样 的 表达 式 代 入 (3.9) 而 求解 是 很 难 的 ,因此 在 应 用 上 , 常 
使 用 更 易于 计算 的 估计 ,如 用 


A=X,5=S 
其 中 X 和 S 分 别 是 样本 均值 和 样本 方差 . 理论 上 知道 ,用 这 一 个 
计 代 赫 由 (3.9) 决 定 的 估计 去 计算 统计 量 Z ,已 使 定理 3.2 的 结论 
不 成 立 了 ,但 差距 还 不 大 , 故 应 用 上 还 是 可 以 . 
以 下 这 两 个 数字 例子 取 自 H. 克拉 美的 《统计 数学 方法 第 30 
理 . 
例 3.7 有 一 取 0,1,2… 为 值 的 离散 变量 ,对 其 进行 了 2608 
次 观察 ,结果 如 下 表 所 示 : 


* 按理 论 的 要 求 (为 了 使 定理 3.1,3.2 的 结论 有 效 ), 划 分 区 间 必 须 在 未 看 到 样本 
之 前 就 做 好 ,而 不 能 依 样本 情况 去 划分 .但 实际 工作 中 难于 遵守 这 一 点 , 它 引 起 的 误差 
-- 般 也 很 小 ,不 必 拘泥 . 
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i 0 1 2 3 4 5 6 7 8 9 (10 11 12) 

y; 37 203 383 323 532 408 273 139 45 27 (10 4 2) 
要 检验 其 分 布 为 波 哇 松 分 布 的 假设 . 

先是 分 组 .对 i=0,1,…9,yv; 都 比较 大 ,可 单独 成 组 .10,11 和 
12 合并 为 一 组 , 故 该 组 的 六 ,应 改 为 10+4+2=16. 

其 次 是 用 样本 估计 波 哇 松 分 布 的 参数 和 .要 是 用 (3.9), 则 其 
为 麻烦 . 此 处 用 其 通常 估计 X: 


A= X= 3.870 
然后 据 此 算出 各 组 理论 值 . 除 最 后 一 组 外 ,理论 值 是 


ne Ai/i! = 2608e-387(3.870)i/il,i = 0,1,...,9 
例如 ,算出 i=0 时 为 S4.399,; = 工时 为 210.523 等 .最 后 一 组 的 
理论 值 为 
12 
2608 > e3870(3.870)i/i! = 17.075 


i=10 
最 后 按 公 式 (3.2) 算 出 统计 量 Z 之 值 ,结果 为 Z,=12.885. 此 处 
二 11( 共 分 11 个 组 ) ,>=1( 有 一 个 参数 4 被 估计 ), 故 自由 度 为 
11-1-1=9. 查 X 分 布 表 ,得 拟 合 优 度 为 p (Zo)=1-- kK。 
(12.885)=0.17. 这 拟 合 优 度 尚 可 ,但 不 太 好 :即使 总 体 真 服从 波 
哇 松 分 布 ,也 有 17% 的 机 会 产生 比 本 例 数据 更 大 的 偏离 .0.17 概 
率 的 事件 当然 不 稀奇 .但 这 概率 毕竟 偏 小 一 些 , 使 人 不 很 放心 . 
例 3.8 瑞典 斯 德 哥 尔 摩 自 1841 年 至 1940 年 ,百年 期 间 6 
月 份 平 均 温 度 的 记录 ,分 组 后 如 下 表 . 要 检验 这 温度 的 分 布 服从 正 
态 分 布 N(w ,ac2) 对 某 个 (wa2)， 


区 局 


(摄氏 度 ) 观察 数 » 
—12.4 14.5—14.9 
12 .9 一 12 .9 15.0—15.4 9 
13.0—13.4 15.5—16.0 6 
13.5—13.9 16.0—16.4 7 
14 .0 一 14 .4 16 .3 一 8 
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克拉 美 给 出 的 jy 和 o 估计 值 是 =14.28,5=1.574. 利 用 这 
组 估计 就 可 以 算出 各 组 的 理论 值 .例如 ,12.5 一 12.9 这 一 组 是 
12.95 — 14.28)? 
0 | | (1 ze jdz 
= 100 x0.0789 = 7.89 
而 一 12.4 这 一 组 为 
12.45 x — 14.28)? 
1 1 sp| - 汪 74 
= 100 x 0.1289 = 12.89 
等 等 , 式 中 的 积分 可 通过 转化 到 标准 正 态 分 布 函 数 去 计算 ， 
| exp[- -L(xX 一 p)? dz 
/D7 20 


Vv 2A0 a 


1 


jd 


一 Oo 


= 
查 标 准 正 态 分 布 表 即 得 . 

注意 以 上 计算 中 的 积分 限 , 它 是 取 在 相 邻 区 间 的 相 邻 端点 的 
中 点 ,这 符合 四 含 五 人 法 则 . 

这 样 算出 各 组 理论 值 后 ,用 (3.2) 算 出 Z 值 .本 例 结 果 为 
7.86. 自 由 度 &-1-r=10-1-2=7. 拟 合 优 度 为 1- 天 (7.86)) 
=0.85. 拟 合 程度 很 高 . 

如 有 果 数 据 一 开始 就 用 分 组 形式 给 出 (原始 数据 没有 给 ,或 最 初 
记录 时 束 只 记 下 它 在 何 区 间 ) , 则 六 和 3 只 能 用 这 分 组 数据 算 . 可 用 
公 王 

尼 三 二 5 mv; ,6 = TD ym 一 庆 ) 
其 中 mx 是 第 i 个 组 区 间 之 中 点 .这 时 ,最 左 最 右 两 个 区 间 也 要 界 
定 , 可 取 其 长 为 其 相 邻 区 间 之 长 . 

最 后 ,如 果 理 论 分 布 下 不 包含 参数 , 则 各 区 间 理 论 值 直接 由 
nL F(a;) 一 F(a;-1)] 算 出 ,一 切 简 单 得 多 . 自由 度 是 一 1,k 为 分 
区 则 数 日 . 

”269 ， 


附 有 录 


A. 若干 检验 的 一 致 最 优 性 
在 本 章 定义 1.3 中 已 给 出 了 一 个 检验 问题 Ho: Hi 的 水 平 a 
一 致 最 优 检验 的 定义 . 它 是 一 切 水 平 a 检验 中 其 功效 在 对 立 假设 
HH! 上 处 处 达到 最 大 的 检验 . 如 已 说 明 的 ,这 种 检验 的 存在 是 稀有 
的 例外 ,但 在 一 些 重要 的 单 参数 分 布 族 的 单 侧 检 验 问题 中 ,以 及 在 
个 别 多 参数 检验 中 , 它 确实 存 在 .5.2 节 中 许多 例子 属于 这 种 情 
况 . 这 里 我 们 来 作 一 些 讨论 . z 
1. 简单 假设 下 的 奈 曼 -皮尔 逊 基本 引 理 
考虑 一 个 最 简单 的 情况 : 原 假设 Ho 和 对 立 假设 昌 | 中 ,都 只 
包含 一 分 布 -为 确定 计 , 设 分 布 都 有 密度 ,离散 型 的 情况 完全 类 似 ， 
只 须 把 积分 变 成 求 和 即 可 .因此 ,有 
五 0 :总 体 有 密度 f(x) 
日 | :总 体 有 密度 fj (x) 
设 X1,… ,XX 为 样本 , 则 (Xi,…,X,; ) 的 密度 ,在 Ho 和 万 |; 之 下 ， 
分 别 为 go(y)= fo(x1)'*fo(xz,) 和 gi1(y)= f(x) fi(x; ). 这 
里 已 简 记 y= (x1,…,x,). 求 这 个 问题 的 水 平 a 的 检验 ,转化 为 
下 述 数 学 问题 : 找 y 空间 之 一 区 域 Q ,作为 检验 的 否定 域 ( 当 (Xi， 
0 X) 落 在 Q 内 时 否定 Fo, 不然 就 接受 昌 ,). 为 使 Q 达到 最 优 ， 
束 必 须 在 条 件 z 


| gol3)dy a 


之 下 ,使 | gi(y)dy 达到 最 大 .很 容易 看 出 :为 达到 这 一 点 ,Q 必 
须 这 样 取 : 把 比值 g1(y) /go(y) 大 的 那些 y 收 进来 .这 就 是 奈 - 皮 
基本 引 理 ， 
奈 - 皮 基本 引 理 水 平 a 的 一 致 最 优 检验 9 的 否定 域 Q 应 如 
下 取 :; 找 常数 C ,使 
Q= iy:gi(y)/go(y) > CI| (1) 
270 、 


而 满足 
| go(y)dy = a (2) 
QQ 
证 (2) 式 保证 了 检验 o 的 水 平 为 a, 现 设 yg 为 男 一 水 平 a 检 


验 ,其 否定 域 为 Q@ . 记 Q 与 QQ 的 公共 部 分 为 R. Qi 记 Q 中 去 掉 
R 的 剩余 部 分 ,Qi 记 Q 中 去 掉 R 的 剩余 部 分 (图 5.5), 则 易 见 


| gdy - | ,ay)dy = | sd ~) (yd (3) 
由 于 wp 有 水 平 c, 有 
| go(y)dy a 
Q 
青 由 (2) 式 , 知 
| go(y)dy 之 | go(y)dy (4) 
Q Q 


1 1 


因为 Qi 在 Q 之 外 , 按 (1) 式 , 当 y 属 于 Qi1 
时 ,有 gi(y) 夺 Cgo(y). 而 当 y 属于 Qi 时 有 图 5.5 
gli(y) >Cgo(Cy) 让 


| gi(y)dy> C| go(y)dy,| gydy <c| go(y)dy 
Qi Qi Q Qi 


由 此 及 (3),(4), 即 知 
| gi(y)dy =| gi(y)dy 
Q Q 


即 检验 yp 的 功效 总 不 小 于 gy 的 功效 ,由 于 w 是 任 取 的 水 平 检 
验 , 证 明了 9 是 水 平 a 的 一 致 最 优 检验 . 

2. 复合 假设 检验 的 情况 

现 考 虑 一 般 的 复合 假设 检验 问题 Hy: Hi. 关于 其 水 平 a 一致 
最 优 检验 的 存在 ,有 如 下 的 简单 结果 : 

定理 在 Ho 中 取 定 一 值 20 ,对 万 | 中 的 值 0; 建立 假设 检验 
可 题 ; 

Ho:00;H'1:01 (5) 
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按 奈 - 皮 引 理 , 求 出 其 水 平 a 一 致 最 优 检验 p. 如果 p 符合 以 下 两 
个 条 件 , 则 它 必须 是 原 问 题 Ho:;HHi 的 一 个 水 平 a 一 臻 最 优 检验 : 

1” 检验 p 也 是 万 0o: 互 ; 的 水 平 a 检验 . 

2 ” 检验 9 不 依赖 于 9 值 . 

证 设 g 为 Ho:Hi 之 任 一 水 平 a 检验, 则 它 必 是 (5) 的 一 个 
水 平 a 检验 .这 很 显然 ;以 8o《9) 记 9 的 功效 函数 .gp 为 Ho: HI 
的 水 平 a 检验 ,意味 着 82) 在 Ho 上 处 处 不 超过 a ,因而 特别 在 
00 点 不 超过 w .这样 ,p 和 9 都 是 (5) 的 水 平 a 检验 而 o 是 (5) 的 
水 平 a 一 臻 最 优 检 验 , 故 8,(01) 宇 Bs (91). 因为 这 个 事实 对 HI 
中 任 一 个 91 都 成 立 , 即 知 o 为 Ho:HHi 的 水 平 a 一 致 最 优 检验 . 

在 本 和 定理 中 ,go 值 如 何 取 ? 对 形 如 9 二 a 或 9 宇 a 这 样 的 单 侧 
原 假 设 ,00 总 是 取 为 a. 

例 1 XX!,…,X, 为 抽 自 正 态 总 体 N(0,o?) 的 样本 ,o? 已 知 ， 
考虑 检验 问题 

五 0:0 委 4; 万:0 > a (6) 
a 为 给 定 弟 数 ， 
按 本 定理 , 取 bo=a, 任 取 9 >a. 作 检验 问题 
Ho:0 = a;H1:0 = 0, (7) 
按 妹 - 皮 基 本 引 理 ,(7) 的 水 平 a 一 致 最 优 检验 wg 有 否定 域 . 


1 " 1 
Ga) (oe exp| - 292 (7 一 901)? | 
1] ” 1 
|( 声 ;) exp| - 373 2 (7 -a)|> c| 
取 对 数 , 易 知 此 集合 为 
(Cri ) :02(0, 一 a) Pz, > Ci 
对 某 个 常数 Cl. 因 9, 一 a >0,o*>>0, 此 集合 化 为 


Er (8) 


的 形状 . C 为 另 一 常数 ,要 使 此 检验 有 水 平 ,应 取 C= na + 
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Vou .此 值 与 9 无 关 , 因 而 定理 的 条 件 2 满足 . 另外 ,这 个 检验 
的 功效 函数 是 1 4 ) ,是 9 的 上 升 函数 .所 以 ,这 个 检 
验 也 是 (6) 的 水 平 a 答 验 .这 笠 , 条 件 1 也 适合 . 据 定理 ,这 检验 就 
是 (6) 的 水 平 a 的 一 致 最 优 检验 . 

指数 分 布 ,二 项 分 布 和 波 哇 松 分 布 参数 的 单 侧 假设 检验 问题 ， 
也 可 以 用 与 本 例 相 同 的 方法 证 明 其 一 致 最 优 检验 存在 . 留 给 读者 
作为 习题 

车 在 本 例 中 考察 双 侧 假设 Ho:0= a,Hi:9 关 a, 则 一 致 最 优 
检验 不 存在 ,其 理由 现在 也 不 难看 出 , 因 现 在 9, 可 以 大 于 a 也 可 
以 小 于 a. 当 91 >a 时 ,检验 问题 (7) 的 一 致 最 优 检验 的 形式 如 
(8). 车 91<a, 则 一 致 最 优 检验 的 否定 域 形 如 


(Cry, ): 3 < C3 


与 (8) 不 同 . 因此 ,定理 的 条 件 2° 不 满足 

B. 非 中 心 t 分 布 与 1 检验 

设 X 与 Y 独立 ,X~N(0,1),Y~x7, 又 设 6 为 常数 , 则 随机 
变量 过 = (X+ Ly 的 分 布 称 为 自由 度 、 非 中 心 参数 6 的 
非 中 心 1 分布, 记 为 Z 一 ts.1a,3 的 分 布 函 数 将 记 为 (x). 当 
6 二 0 时 ,就 得 到 在 第 二 章 例 4.10 中 介绍 过 的 自由 度 的 t 分 布 
(有 时 称 中心 1 分 布 ). 

非 中心 1 分 布 也 是 数理 统计 应 用 上 的 重要 分 布 ,但 其 分 布 函 
数 已 ,s(x ) 的 形式 很 复杂 ,此 处 不 去 介绍 .只 提 到 一 点 对 下 文 有 用 
的 性 质 :者 82>61, 则 户 ,,s,(x) 三 已,,s (zx). 事实 上 , 记 


Z = (X+ 3) Ty, = 1,2 
X,Y 如 上 文 所 述 , 则 有 ZX 2DD, 故 对 任何 工 有 P(ZI 三 xX) 宇 
P(Z;x), Bi Fr, (rT)F,,3, (7). 
有 了 这 些 准 备 , 我 们 可 以 解决 5.2 节 中 遗留 下 来 的 有 关 1 检 
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验 的 问题 . 
设 X1,…,X, 为 抽 自 N(9,o ) 中 的 样本 ,0,0 都 未 知 ,对 假 
设 检验 问题 
Ho:0 之 00,H1:0 < Oo 
我 们 引进 了 上 检验 y, 由 (2.14) 给 出 .其 功效 函数 为 (2.15). 现 易 
知 ,(2.15) 的 B,(0,o ) 为 : 
By,(0,0) 一 Fi, Va(0- 0 )/a( — tn-1(Q)) (9) 


事实 上 ,有 
/A(X - 00)/S = [2-0 ,Vn(0-— go)) Ts: 


当 参 数值 为 (9,o) 时 ,Vn(X-0)/o~N(0,1),(n -1)S?/o?~ 
-1, 且 二 者 独立 . 故 按 非 中 心 :分布 的 定义 及 (2.15) 式 , 即 得 
(9). 

由 (9) 式 可 知 , B,(09,o) 为 9 的 下 降 旺 数 . 因 当 9 增加 时 ， 
Vn(9- 00)/o 增加 . 按 前 面 证 明 的 性 质 , 即 知 (9) 式 右边 下 降 , 因 
为 8(b,5)=a, 知 当 0 之 6 时 有 PB,(9,o) 志 a. 这 证 明了 :t 检验 
(2.14) 有 水 平 a. 

其 次 ,功效 隔 数 (9) 的 形式 也 说 明 :给 定 01 之 06 及 8< c ,不论 
你 取样 本 大 小 n 多 大 ,也 无 法 保证 对 一 切 o>0 有 B,(91,o) 宇 B， 
事实 上 ,固定 2 , 当 c-~>co 时 有 

limpBy( 01,0) = lim Fy, /a(0-0) /~ tn-1(a)) 
=F,-1,0(— tri(a)) = a 
这 样 ,不 论 你 固定 ”多 大 ,只 要 a 充分 大 ,就 可 以 使 (6 ,cj)< 
B. 

如 有 果 以 o 为 单位 来 衡量 bg 与 b 的 差距 , 即 要 求 当 
(91 一 90)/o 固 定 为 某 个 指定 的 60<0 时 有 PB,(9,,o) 宇 8(B 为 指定 
的 小 于 1 的 数 ), 则 这 可 以 做 到 : 只 须 取 ”充分 大 ,使 Fy 
(一 -1(a)) 宇 B. 这 可 以 通过 查 非 中 心 上 分 布 表 求 得 . 
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这 个 在 实用 上 看 也 是 合理 的 .在 方差 未 知 时 ,均值 距离 的 实际 
意义 如 何 , 往 往 要 看 方差 大 小 而 定 .方差 愈 大 ,一 定 的 均值 距离 意 
义 就 愈 小 .好 比 秤 的 误差 愈 大 ,两 件 东西 的 重量 就 必须 有 园 大 的 差 
别 ,才能 镑 有 把 握 地 在 这 把 释 上 显示 出 来 .(9) 式 中 的 功效 图 数 , 通 
过 (9 一 00)/o 而 依赖 于 (0,c) ,反映 了 这 一 点 . 

类 似 的 结论 对 两 样本 上 检验 当然 也 成 立 ,我 们 把 细节 留 给 读 
者 去 完成 . 


习 题 


1. 设 X 为 抽 自 正 态 总 体 NCb,c2) 中 的 样本 (样本 大 小 为 1).o 已 知 ,a， 
b 都 是 给 定常 数 ,a 忆 0. 要 找 原 假设 五 :aa 委 9 委 8 的 水 平 a 检验 .完成 以 下 的 
步骤 : 

1" 从 直观 考虑 ,Ho 的 接受 域 应 取 为 CI 和 X 委 C; , 即 当 CI 委 X 雪 C， 时 接 
受 五 0 ,不 然 就 否定 Ho. 写 出 这 个 检验 的 功率 肾 数 8(0). 

2" 找 出 常数 C1,C; 使 1° 中 找 出 8(8) 满 足 

pla) = B(b)= a 

3 证 明 由 1 ,2 决定 的 检验 确 是 五 o 的 水 平 a 检验 , 即 8(9) 志 a 当 a 志 9 
<b. 

4" 证 明 这 样 决定 的 检验 满足 

8(0) 一 1, 当 |01 一 oo 

解释 这 个 结果 的 意义 . 

5 如 果 XX ,…, 义 , 为 抽 自 NC(9,o ) 的 样本 ,o 已 知 ,利用 上 面 的 结果 作出 
Ho 的 检验 . 

2. 设 Xi,…,X, 是 抽 自 指数 分 布 总 体 的 样本 ,0<a<p,a,B 为 已 知 常 
数 .要 检验 原 假设 有 :a 三 4 三 5. 描述 一 下 (不 须 详 细 推 导 ) 用 解 第 1 题 的 思 
想来 解 这 个 问题 的 过 程 . 

3. 设 XX,…,X, 和 六 ,…, YY 分 别 是 抽 自 正 态 总 体 N(a,o?) 和 N(b， 
o5) 的 样本 ,a ,6 未 知 而 of,o5 已 知 . 试 作出 原 假设 Ho:a 二 65 的 水 平 a 检验 . 
给 定 di 0,d2>0, 令 m =n, 决 定 n, 使 当 | a 一 5| 实 di 时 ,功效 函数 不 小 于 
1— d;. 

4. 设 六 ,…,X 和 YY ,…, Ym 分 别 是 抽 自 正 态 总 体 N(a,o?) 和 N(6， 
o ) 的 样本 ,a,5,o? 都 未 知 . 试 仿照 两 样本 上 检验 的 做 法 ,构造 出 原 假设 万 ,: 
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a 三 cb 的 一 个 水 平 a 检验 .这 里 c 关 0 为 已 知 常数 . 

5. 利用 上 题 的 结果 解决 如 下 的 检验 问题 : 设 XI，…,X 和 了 TY 
分 别 是 抽 自 正 态 总 体 N(a,o?) 和 N(b5,o;) 的 样本 ,a,b,oi,o5 都 未 知 , 但 比 
值 o3/oi 一 已 知 ,要 检验 原 假设 Ho:a= 56. 

6. 设 久 1，,… ,XX, 为 抽 自 有 具 参数 为 41 的 指数 分 布 的 样本 ,Yi ,…, Y,, 为 
抽 自 具 参 数 为 4, 的 指数 分 布 的 样本 .作出 原 假设 Ho:4| 硅 A; 的 水 平 a 的 检 
验 . 

7. 设 义 1,…,X, 是 抽 目 均匀 分 布 R(0,8) 的 样本 ,给 定 964>0. 作 出 原 假 
设 Ho:;0 夺 ;的 水 平 a 检验. 

8. 设 义 |,…,X, 是 从 有 下 述 密度 函数 的 总 体 中 抽出 的 样本 : 

f(r,0) = er, rE -co<b<eo 
0， >0 

给 定 弟 数 四 .作出 原 假设 Ho:9 志 0, 的 水 平 a 检验 . 

注 :第 7,8 题 都 需要 先 由 直观 出 发 定 出 检验 统计 量 , 再 根据 水 平 a 定 临 
界 值 . 

9. 设 和 为 自负 二 项 分 布 


;+1 


PAX=A=( 


ja — p)", 

k=0,1,2,;0 < 0O<1 
中 抽出 的 样本 .给 定 90,0< Oo<1. 找 原 假设 五 0:9 委 0 的 水 平 uc 检验 .如 要 
求 水 平 严格 地 为 ,如何 实行 随机 化 ? 

10. 在 上 题 中 ,如 果 设 2 有 先 验 分 布 尺 (0,1), 求 该 题 中 原 假设 已 的 忠 
叶 斯 检验 . 

11. 在 第 7 题 中 ,如 果 设 6 有 先 验 分 布 R(0,a)(a 已 知 且 a > 0,). 试 求 
该 题 中 原 假 设 Ho 的 贝 叶 斯 检验 . 

12. 事件 A 在 一 试验 中 发 生 的 概率 记 为 p, 为 检验 原 假设 有 H,: pp 过 1/2 
是 否 成 立 , 甲 乙 二 人 分 别 采用 下 述 做 法 : 甲 重复 试验 到 A 第 9 次 出 现时 停 
止 , 乙 重 复试 验 到 A 第 3 次 出 现时 停止 ,两 人 都 在 做 完 第 12 次 试验 时 ,结束 
试验 . 取 检 验 水 平 a =0.05. 问 :甲乙 两 人 分 别 从 其 试验 结果 中 作出 何 种 结 
论 ? 你 从 本 题 结果 得 到 什么 启发 ? 

13. 设 样本 久 ~~B(ni1,p1),Y~B(n,,p;). 要 检验 假设 Ho: pi1= p2. 设 
nm 和 nn, 都 充分 大 , 试 作出 Ho 的 水 平 a 的 大 样本 检验 . 

14. 设 样本 X 服从 波 蛙 松 分 布 P(A). (a) 试 用 中 心 极 限定 理 证 明 : 当 A 
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一 co 时 有 
(X -A)/YA—> NO,1) 
(b) 设 io 充分 大 .用 (a) 的 结果 ,作出 原 假 设 Ho:X = 0 的 水 平 a 大 样本 检 


HW . 


15. 在 5.2 节 5.2.4 段 “定数 截 尾 "检验 中 ,我 们 定义 了 检验 统计 量 本 
( 见 (2.34) 式 ) ,并 曾 指出 24T~ xy2. 这 个 结果 直接 证 明 较 繁 ,但 用 下 面 的 归 
纳 法 容易 证 明 , 试 完成 以 下 步骤 . 

1" 当 r=1 时 ,这 结果 成 立 .为 此 注意 到 当 y=1 时, 丁 就 是 nY| 而 Yi = 
min( X11,"…,X,). 用 第 二 草 22 题 及 f(x)=Ae “,x>0, 当 xz 所 0 时 f(x)= 
0, 易 求 出 Y| 之 分 布 ,因而 求 出 工 的 分 布 .由 此 算出 2XT 有 密度 函数 


六 e 72( 当 >0, 下 同 ), 此 即 如 的 密度 . 


2" 设 r= 上 时 结果 成 立 ( 归 纳 假设 ), 要 证 明 当 v= 有 +1 时 结果 也 成 立 . 
为 此 ,分 别 用 五 和 五 记 当 rr=&A 和 r= 上 +1 时 的 斑 值 ,而 分 析 一 下 二 者 
的 关系 ,如 右 图 5.6, 分 别 显示 出 2 个 元 件 依次 失效 时 的 寿命 了 ,…, 立 .并 
为 方便 计 ,把 Y 和 YY ;1 分 别 记 为 a 和 465. 从 图 上 明显 看 出 : 

Toil= Tt(n- kb-a) (1) 

ba 是 什么 ? 就 是 从 时 刻 a 起 算 , 当 时 尚未 失 
效 的 n 一 个 元 件 中 最 早 失效 的 那个 元 件 的 失 ” 汪 一 
效 时 间 ( 以 a 为 0 点 的 时 间 !1). 这 样 一 来 (n 一 一 -一 ~ 
k)(5 -a) 不 是 别 的 , 正 是 n 一 上 个 指数 分 布 变 二 
星 的 最 小 值 乘 以 个 数 n (这 里 用 了 指数 分 布 "” 
的 无 后 效 性 : 当 一 个 元 件 在 时 刻 a 尚未 失效 时 ， 
其 以 a 为 起 点 以 后 的 寿命 , 仍 服从 原来 的 指数 | 5.6 
分 布 . 见 第 二 章 例 1.7) .根据 1" 中 已 证 的 ,24(n 
到 )(a 一 56) 一 X33. 另外 ,(1) 式 右边 两 项 有 独立 性 .这 也 是 根据 指数 分 布 无 后 
效 性 的 考虑 ,而 根据 归纳 假设 ,24T; 一 Xx 缴 . 故 由 卡 方 分 布 性 质 , 知 24T 一 
X34 + 这 完成 了 归纳 证 明 . 

这 也 是 一 种 概率 方法 一 一 不 是 单 任 分 析 计 算 , 且 利用 概率 的 考虑 . 它 不 
仅 简化 了 证 明 , 也 使 我 们 明白 了 为 什么 有 这 个 结果 的 道理 所 在 . 

16. 设 变 量 X 取 1,2,3,4 等 值 .有 一 种 理论 认为 ,X 取 这 4 个 值 的 概率 
旦 等 比 级 数 , 即 

P(X =2)/P(X = 1) = P(X = 3)/P(X = 2) 
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~ P(X = 4)/P(X = 3) 

为 验证 此 理论 是 否 正 确 , 对 X 进行 2 次 观察 ,发 现 X 取 1,2,3,#+ 为 值 分 别 有 
ni1;72,73,14 次 . 试 作 拟 合 优 度 检 验 ,描述 步骤 即 可 以 ,不 必 去 解 方 程 . 

17. 为 检验 变量 X 的 分 布 是 否 为 指数 分 布 ( 参 数 A 未 知 ), 选 择 适 当 常 
数 ca>0 及 自然 数 &, 把 区 间 [0,ece) 分 成 &+1 份 :万 =[0,a), 访 =[c,2a)， 
(kk 一 1)a,ka), 了 11=[ka, 吕 ),. 用 5.3 节 5.3.4 段 的 方法 作 拟 合 优 
度 检 验 , 了 包括 该 处 所 介绍 的 估计 未 知 参数 的 方法 去 估计 4. 以 n 记 观 察 次 数 ， 
21, 72572011 分 别 记 这 7 个 观察 值 中 落 人 五 ,1 ,…, 41 中 的 个 数 . 

18. 证 明 四 格 表 的 公式 (3.16). 

19. 对 由 本 章 (3.2) 式 定义 的 拟 合 优 度 统计 量 Z, 我 们 有 定理 3.1:; 在 原 
假设 下 Z 一 x4-1 当 mn 一 %. 此 定理 未 予 证 明 , 但 我 们 可 以 得 出 若干 侧 证 : 

1 在 原 假设 成 立时 EE(Z)= 儿 -1, 与 x?_ 1 的 均值 致 ; 

2 在原 假 设 成 立时 ,Var(Z) 也 可 以 算出 来 ,从 其 表达 式 易 看 出 ;Var(Z) 
一 2 一 1) 当 2 一 co, 邵 收 伍 于 yk_1 之 方差 . 

1 很 容易 ,请 读者 证 明 .2" 很 繁 但 不 难 . 请 读者 指出 计算 Var( ZI) 的 详细 
步骤 ,如 能 坚持 算出 结果 当然 很 好 . 

20.( 此 题 用 到 附录 A 的 方法 ) 

1 考虑 5.2 节 5.2.5 段 的 检验 问题 1. 证明: 由 (2.38) 定 义 的 检验 o( 选 
择 其 中 的 C 使 检验 水 平 为 a) 是 水 平 a 的 一 致 最 优 检验 . 

2 考虑 5.2 节 5.2.6 段 的 检验 问题 1. 证明: 由 (2.47) 定 义 的 检验 9\ 选 
择 其 中 的 C 使 检验 水 平 为 a) 是 水 平 a 的 一 致 最 优 检验 . 
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第 六 章 回归、 相关 与 方差 分 析 
6.1 回归 分 析 基 本 概念 


本 章 所 要 讨论 的 题目 都 是 在 数理 统计 学 中 应 用 很 广泛 的 分 
支 .它们 有 一 个 共同 点 , 即 都 是 研究 变量 之 间 的 关系 .这 些 变量 可 
以 是 随机 的 ,也 可 以 是 非 随 机 (可 以 理解 为 能 由 人 所 控制 ) 的 ,但 不 
能 全 部 为 非 随 机 的 .它们 的 不 同 之 处 在 于 :回归 分 析 着 重 在 寻求 变 
量 之 间 近 似 的 函数 关系 ,相关 分 析 则 不 着 重 这 种 关系 ,而 致力 于 寻 
求 一 些 数 量 性 的 指标 ,以 刻画 有 关 变 量 之 间 关 系 深 浅 的 程度 .第 三 
章 中 讨论 过 的 相关 系数 ,就 是 这 样 的 一 个 指标 .方差 分 析 着 重 考虑 

一 个 或 一 些 变量 对 一 特定 变量 的 影响 有 无 及 大 小 ,由 于 其 方法 是 
基于 样本 方差 的 分 解 , 故 得 名 .以 上 只 是 一 个 很 一 般 的 描述 ,在 以 
后 的 叙述 中 将 加 以 充实 和 确切 化 . 

我 们 先 来 谈 回 归 分 析 .“ 回 归 ” 一 词 的 来 由 将 在 后 面 加 以 解释 . 
在 现实 世界 中 存在 着 大 量 这 样 的 情况 :两 个 或 多 个 变量 之 间 有 一 
些 联系 ,但 没有 确切 到 可 以 严格 决定 的 程度 .例如 ,人 的 身高 X 和 
体重 Y 有 联系 ,一般 表现 为 X 大 时 , Y 也 倾向 于 大 ,但 由 XX 并 不 
能 严格 地 决定 Y. 一 种 农作物 的 雷 产 量 Y 与 其 播种 量 Xi ,施肥 量 
X;, 有 联系 ,但 Xi,X2 不 能 严格 决定 了 .工业 产品 的 质量 指标 Y 
与 工艺 参数 和 配方 等 有 联系 ,但 后 者 也 不 能 严格 决定 Y. 

在 器 上 上 湛 例 及 类 似 的 例子 中 ， Y 通常 称 为 因 变 量 或 预报 量 ， 
X ,Xi,X: 等 则 称 为 自 变 量 或 预报 因子 . 因 变 量 自 变量 的 称呼 借 
用 目 函 数 关系 , 它 不 十 分 妥 贴 ,因为 ,有 时 变量 间 并 无 明显 的 因果 
关系 存在 .例如 ,不 好 说 一 个 人 的 身高 是 因 体重 是 果 , 因 为 你 也 可 
以 反 过 来 说 ,该 人 身高 是 因 其 体重 大 .预报 量 与 预报 因子 的 名 称 来 
源 于 实际 . 因为 在 应 用 中 ,多 是 借助 于 一 些 变量 之 值 去 预测 另 一 些 
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变量 之 值 . 比如 说 ,用 播种 量 和 施肥 量 去 预测 产量 . 这 名 称 也 非 十 
分 完善 ,因为 在 回归 分 析 的 某 些 应 用 中 ,并 无 预报 的 含义 .迄今 ; 
止 , 对 X( 或 (Xi,X2…)) 和 Y 并 无 一 种 一 致 采用 或 公认 为 妥 贴 的 
称呼 ,为 简单 计 , 今 后 我 们 将 固定 使 用 自 变量 和 因 变 量 这 一 对 名 
启 . 

为 什么 由 Xi1, X2> 等 不 能 严格 决定 Y? 理由 很 清楚 . 拿 农 作 
物 那 个 例子 来 说 ,影响 产量 Y 的 因素 (变量 ) 很 多 , 远 不 止 播种 量 
Xi 和 施肥 量 X; 二 者 ,其 他 如 灌溉 情况 ,气温 变化 情况 ,灾害 ( 病 
虫害 ,风灾 之 类 ) ,都 影响 到 Y. 这 些 因 素 中 ,有 可 以 人 为 控制 的 
(如 已 考虑 的 Xi,X2), 有 原则 上 可 控 但 因 技 术 .经 济 力量 不 及 ,或 
研究 工作 目标 有 限 未 子 控 制 的 ,还 有 一 大 批 难于 控制 的 随机 因素 . 
因此 ,已 考虑 的 因素 X| ,XX 只 能 在 一 定 程度 上 决定 产量 Y ,其 余 
则 委 之 于 随机 误差 .因此 ,在 回归 分 析 中 , 因 变 量 总 是 看 作为 随机 
变量 .至 于 自 变量 则 情况 较 复杂 :有 随机 的 ,如 人 的 身高 体重 那个 
例子 ,不 是 给 定 身 高 去 测 体重 ,而 是 随机 地 抽出 一 个 人 ,同时 测 其 
身高 体重 , 故 二 者 都 是 随机 变量 .也 有 非 随 机 的 ,农作物 例 中 的 播 
种 量 和 施肥 量 即 是 ,它们 的 取 值 可 以 由 人 控制 ,从 数理 统计 学 的 理 
论 上 说 这 二 者 有 差别 .但 从 实用 上 说 ,人 们 往往 把 随机 自 变量 当 作 
非 随机 去 处 理 ,但 对 结果 的 解释 要 小 心 , 以 后 再 谈 . 在 本 音 6.2 和 
6.3 这 两 市 中 , 除 有 特别 声明 ,我 们 将 一 律 把 自 变 量 视 为 非 随机 
的 . 

现 设 在 一 个 问题 中 有 因 变 量 Y ,及 自 变量 X， ，,… ,Xp. 可 以 设 
想 Y 的 值 由 两 部 分 构成 :一 部 分 由 XX1,…, 六 ,的 影响 所 致 , 这 一 
部 分 表 为 X1，…,X， 的 消 数 形式 f(X1,…,X,). 另 一 部 分 则 由 其 
他 众多 未 加 考虑 的 因素 ,包括 随机 因素 的 影响 所 致 , 它 可 视 为 种 
随机 误差 , 记 为 e. 于 是 得 到 模型 . 

Y = f(X1,.%, X,) +e 
e 作为 随机 误差 ,我 们 要 求 其 均值 为 0: 
E(l(e)=0 
于 是 得 到 :了 (XI,…,X,) 就 是 在 给 定 了 自 变 量 X1,…,X, 之 值 的 
280 ，: 


条 件 下 , 因 变 量 Y 的 条 件 期 望 值 .可 写 为 ” 
fCX1,%, ) = E(Y|X1,, X,) 
函数 f(xz1,… ,zp ) 称 为 Y 对 Xl1,…, Xs 的 “回归 函数 ”, 而 方程 
y= fxr1s** ,Tp) 

则 称 为 Y 对 义 ! ,…,X, 的 “回归 方程 .有 时 在 回归 函数 和 回归 方 
程 之 前 加 上 “理论 ”二 字 , 以 表明 它 是 直接 来 自 模型 ,也 可 以 说 是 模 
型 的 一 个 组 成 部 分 ,而 非 由 数据 估计 所 得 .后 者 称 为 “经 验 回 归 哨 
数 ” 和 “经 验 回 归 方 程 ”. 

设 & 为 一 随机 变量 , 则 EE(€ 一 c)? 作 为 c 的 函数 ,在 c= EE(E) 
处 达到 最 小 .由 这 个 性 质 ,可 以 对 理论 回归 函数 f(z1,…,z,) 作 下 
面 的 解释 :如 果 我 们 只 掌握 了 因素 Xi，…,Xo ,而 希望 利用 它们 的 
值 以 尽 可 能 好 地 通 近 Y 的 值 , 则 在 均 方 误差 最 小 的 意义 下 ,以 使 
用 理论 回归 水 数 为 最 好 . 

但 在 实际 问题 中 ,理论 回归 函数 一 般 总 是 未 知 的 ,统计 回归 分 
析 的 任务 ,就 在 于 根据 Xi,…,X。 和 了 的 观察 值 ,去 估计 这 个 函 
数 , 及 讨论 与 此 有 关 的 种 种 统计 推断 问题 ,如 假设 检验 问题 和 区 间 
估计 问题 .所 用 的 方法 ,在 相当 大 的 程度 上 取决 于 模型 中 的 假定 ， 
也 就 是 对 回归 机 数 f 及 随机 误差 e 所 作 的 假定 . 先 说 回归 函数 了 . 
一 种 情况 是 对 了 的 数学 形式 并 无 特殊 的 假定 ,这 种 情况 称 为 “ 非 
参数 回归 ”. 另 一 种 情况 , 即 目 前 在 应 用 上 最 多 兄 的 情况 ,是 假定 f 
的 数学 形式 已 知 ,只 其 中 若干 个 参数 未 知 . 例如 , 户 =2, 而 已 知 
六 zzo) 形 如 


7(zlyz2) = C1 + e203 ! + calogzr2 
其 中 c,…,c4 是 未 知 参 数 , 要 通过 观察 值 去 估计 .这 种 情况 称 为 
“参数 回归 ”. 其 中 在 应 用 上 最 重要 且 在 理论 上 发 展 得 最 完善 的 特 


* 以 往 我 们 定义 条 件 期 望 时 ,是 假定 所 有 的 变量 都 为 随机 的 .如 今 自 变量 XX,,…， 
XX 并 非 随机 , 故 记号 E(Y | Xi1,…,X,) 只 是 一 种 借用 .可 以 简单 地 理解 为 :Y 的 分 布 
依赖 于 参数 XX! ,…, Xp , 故 其 期 望 值 也 应 与 XU,…,X 有 关 . 
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例 , 是 广 为 线 性 晒 数 的 情形 : 

FUZ1 Tp) = 00+DICITT *** + Opry 
这 种 情况 时 做 “线性 回归 ”, 是 我 们 今后 讨论 的 主要 对 象 .线性 回归 
的 限制 看 来 较 强 .不 过 ,如 果 目 变量 变化 的 范围 不 太 大 ,而 曲面 y 
= f(x1，"… ,Xp) 弯 曲 的 程度 也 不 过 分 , 则 在 较 小 的 范围 内 , 它 可 以 
近似 地 用 一 个 平面 ( 即 线 性 六 数 ) 去 代替 之 ,而 不 致 引起 过 大 的 误 
差 .其 次 ,有 些 形式 上 看 是 非 线 性 的 回归 也 数 ,可 能 通过 自 变 量 的 
代 换 转化 为 线性 的 , 见 6.3 节 .因此 ,线性 回归 模型 有 比较 大 的 适 
用 和 面 , 加 之 它 处 理 上 简便 ,成 为 一 个 极其 重要 的 模型 . 

对 随机 误差 e ,我 们 已 假定 其 均值 E(e)=0.e 的 方差 o? 是 回 

归 模 型 的 一 重要 参数 ,因为 

ElY- f(Xi,,X,)) = E(e*) = Var(e)= 0 
o” 愈 小 ,用 f(X1,…,X,) 通 近 Y 所 导致 的 均 方 误差 就 愈 小 ,回归 
方程 也 就 愈 有 用 .o? 的 大 小 由 什么 决定 呢 ” 这 就 在 于 以 下 两 点 : 

1. 在 选择 自 变量 时 ,是否 把 对 因 变 量 Y 有 重要 影响 的 那些 
都 收 进来 了 . 如果 是 这 样 , 则 未 被 考虑 的 即 作 为 随机 误差 去 处 理 的 
那些 因素 ,总 的 起 作用 就 较 小 ,因而 o? 也 就 会 较 小 .反之 , 若 遗 漏 
了 或 因 条 件 关 系 , 使 某 些 对 Y 有 重要 影响 的 因素 未 被 考虑 , 则 其 
影响 进入 随机 误差 e ,将 导致 a? 增 大 . 

2. 回归 销 数 的 形状 是 否 选 得 准 .比如 ,理论 回归 函数 f(x， 
…,Xp) 本 是 一 个 非 线 性 函数 ,而 你 用 一 个 线性 函数 g (ZI 
Xs), 则 二 者 的 差距 fg 就 作为 一 种 误差 进入 e 内 ,而 加 大 了 它 
的 方差 . 

因此 在 应 用 上 ,通过 观察 数据 对 误差 方差 o? 作 估 计 , 也 是 很 
重要 的 .如 采 佑 计 值 很 大 ,超过 了 该 项 应 用 所 能 承受 的 范围 , 则 佑 
计 所 得 的 回归 方程 意义 就 不 大 .在 这 个 时 候 ,就 有 必要 再 考虑 一 下 
目 变量 的 选择 是 否 抓 着 了 主要 因素 ,以 及 所 用 的 回归 方程 的 形式 
是 人 否 太 不 符合 实际 . 

如 采 要 处 理 有 关 的 检验 和 区 间 估 计 问 题 ,比方 说 , 取 定 了 线性 
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回归 函数 bo +b1xi +… +bsts, 有 对 未 知 系数 b; 等 作假 设 检验 和 
区 间 舍 计 的 问题 , 则 只 有 在 假定 随机 误差 。e 服从 正 态 分 布 
N(0,c2) 时 , 才 有 满意 的 小 样本 方法 .因此 ,在 实用 回归 分 析 中 ,党 
假定 误差 服从 正 态 分 布 .经 验证 明 : 对 多 数 应 用 问题 来 说 ,这 个 假 
定 是 可 以 接受 的 ,如 果 没 有 这 个 假定 , 那 就 需要 使 用 大 样本 方法 . 

回归 分 析 的 应 用 ,可 以 归纳 为 以 下 几 方 面 . 

第 一 方面 是 纯 描 述 性 的 .为 简单 计 ， 
以 一 个 自 变 量 X 的 情况 为 例 , 因 变量 总 
记 为 了 .假定 在 工作 中 我 们 经 浓 要 记录 
X 和 YY 之 值 (比如 说 ,XX 代表 月 份 ,Y 代 
表 该 月 的 产值 ) ,而 积累 了 一 批 数据 (Xi， 
Yi),X2Y2) (XI) 把 它们 标 
在 直角 坐标 系 上 , 称 为 散 点 图 . 这 往往 是 0 
杂乱 无 章 的 ,但 仍 可 能 有 某 种 趋势 存在 .如 图 6.1 中 的 点 虽 系 杂乱 
无 章 ,但 大 体 呈 现 出 一 种 直线 走 问 的 趋势 .用 回归 分 析 的 方法 可 找 
出 一 条 较 好 地 代表 这 些 点 的 走向 的 直线 !. 在 一 定 程度 上 ,这 条 直 
线 /1 描述 了 所 观察 到 的 这 批 数据 所 遵从 的 规律 , 虽 不 十 分 准确 ,但 
有 时 很 有 用 . 

这 种 应 用 之 所 以 称 为 描述 性 的 ,是 因为 它 只 是 对 数据 的 一 种 
-总结 , 它 只 涉及 现 有 数据 ,不 超出 其 外 ,用 统计 的 语言 说 , 它 并 不 
企图 对 数据 (Xi ,| ),…,(X; ,YY, ) 所 来 自 的 总 体 作 任 何 推断 . 

第 二 方面 是 估计 回归 函数 f. 仍 拿 人 的 身高 X 和 体重 Y 这 个 
例子 来 说 ,姑且 把 X 视 为 自 变量 而 Y 为 因 变量 . 若 假定 (X,Y) 服 
从 二 维 正 态 分 布 , 则 如 在 第 二 章 中 已 证 明 的 ,了 对 X 的 回归 也 数 
Fz), 即 条 件 期 望 忆 (YX=>z), 为 z 的 线性 函数 50+6iz. 如 果 
通过 样本 对 6o 和 51 作出 了 估计 20 和 561, 则 用 56+ 61x 去 估计 
bo+ biXx .在 本 例 中 ,后 者 就 是 在 身高 为 xz 的 人 群 中 的 平均 体重 . 
这 在 应 用 上 很 有 意义 ,因为 在 不 少 问 题 中 ,我 们 所 关心 的 正 是 这 个 
平均 值 . 再 拿 亩 产 Y 与 播种 量 Xi 与 施肥 量 Xs 的 关系 这 个 例子 
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来 说 ,也 许 我 们 所 关心 的 正 是 在 一 定 播种 量 zx 和 一 定 施肥 量 z， 
之 下 ,平均 南 产 能 达到 多 少 . 这 就 是 Y 对 XI, X; 的 回归 也 数 
f(x1, rT2). 

第 三 方面 是 预测 , 即 在 特定 的 自 变量 值 (zio,…,zoo) 之 下 ,去 
预测 因 变 量 Y 将 到 的 值 yo .例如 ,随意 碰 到 一 个 人 测 出 其 身高 为 
ro, 而 没有 秤 其 体重 或 各 了 没有 把 结果 告诉 你 ,让 你 去 预测 这 人 
体重 有 多少. 这 与 估计 身高 为 xo 的 人 群 的 平均 体重 f (xo) = 
E(Y|X= Xo) 不 同 .后 者 并 非特 定 的 一 个 身高 为 r 的 人 的 体重 ， 
而 是 全 体 这 样 的 人 体重 的 平均 值 , 而 预测 的 对 象 则 是 这 个 特定 的 
人 的 体重 . 从 模型 上 可 以 这 样 看 : 没 在 X = XX, 处 进行 观察 ,随机 
误差 为 eo, 而 Y 之 值 为 yo, 则 yo= f(xo)+ ev. 为 了 预测 yo ,需要 
对 太 zo) 进 行 估计, 同时 也 对 随机 误差 值 eo 作 估 计 , 把 二 者 相 加 
得 出 yo. 随机 误差 eo 之 值 凭 机 会 而 定 ,没有 什么 好 的 估计 方法 ， 
只 能 根据 其 均值 为 0 这 一 点 ,将 其 值 估 计 为 0. 于 是 Y 的 预测 值 就 


取 为 回归 消 数 f(r) 在 这 个 点 zo 处 的 估计 f(ro). 

由 这 里 得 出 两 条 结论 :一 是 预测 问题 与 回归 函数 问题 虽然 在 
实质 上 很 不 一 样 (如 前 面 所 曾 解释 的 ) ,但 二 者 之 解 则 一 样 .因为 这 
一 点 ,有 些 著作 没有 强调 这 二 者 的 区 别 所 在 . 二 是 预测 的 精度 要 比 
估计 回归 函数 的 精度 差 . 因为 在 预测 中 ,除了 估计 回归 函数 有 一 个 
误差 外 ,还 要 加 上 一 个 随机 误差 ej. 这 一 点 在 考虑 区 间 估 计时 能 
更 清楚 地 看 出 来 . 

第 四 方面 是 控制 .在 这 类 应 用 中 ,不 妨 把 自 变 量 解 释 为 输入 
值 , 因 变量 解释 为 输出 值 . 目标 是 要 把 输出 值 控制 在 给 定 的 水 平 


yo. 车 通过 数据 估计 出 了 经 验 回 归 方 程 y= 广 (zi,…,z), 则 根据 
这 方程 可 调整 自 变量 X1,…, XX, 的 取 值 ,以 达到 上 述 目 的 .例如 ， 
自 变量 X 是 用 药 量 , 而 Y 是 某 种 生理 指标 ,例如 血压 ,调整 用 药 
量 以 使 血压 达到 某 种 认为 是 正常 的 水 平 ， 
我 们 提 一 下 “回归 设计 ”这 个 概念 . 为 了 估计 理论 回归 函数 
f(x1,…,zp) ,需要 对 自 变量 Xi ,…,X， 和 因 变 量 Y 进行 观测 .有 
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两 种 情况 :一 是 自 变 量 也 是 随机 的 ,如 人 的 身高 体重 那个 例子 ,这 
时 除了 一 般 地 保证 抽样 的 随机 性 以 外 ,就 没有 多 少 可 做 的 事情 了 . 
例如 在 一 大 群 人 中 抽取 若 于 以 量 测 其 身高 体重 , 则 只 须 尽 力 保 证 
人 和 群 中 的 每 一 个 有 同等 的 被 抽出 的 机 会 . 

另 一 种 情况 是 自 变量 是 非 随 机 的 ,其 取 值 在 一 定 限 度 内 可 由 
人 去 控制 .这 时 ,为 保证 取得 最 大 的 效果 ,应 对 自 变 量 在 各 次 试验 
中 所 取 的 值 进行 适当 的 规划 .例如 ,车 在 将 来 的 应 用 中 自 变 量 多 取 
某 区 域 B 上 之 值 , 则 在 进行 试验 时 就 要 让 自 变量 多 在 这 个 范围 内 
取 值 .也 可 以 设想 ,试验 点 在 空间 的 排列 可 能 需要 有 某 种 对 称 性 ， 
以 便于 统计 分 析 . 这些 问题 的 研究 构成 了 回归 分 析 的 一 个 分 支 , 叫 
做 回归 设计 , 它 也 可 以 看 作 是 试验 设计 这 个 统计 学 分 支 的 一 个 组 
成 部 分 ,本 章 将 不 讨论 这 方面 的 问题 . 

最 后 我 们 来 解释 一 下 “回归 ”这 名 称 的 由 来 .这 个 术语 是 英国 
生物 学 家 兼 统 计 学 家 下 . 高 尔 顿 在 1886 年 左右 提出 来 的 . 人 们 大 
概 都 注意 到 , 子 代 的 身高 与 其 父母 之 身高 有 关 . 高 尔 顿 以 父母 之 平 
均 身 高 X 作为 自 变 量 , 某 成 年 子女 身高 的 平均 Y 为 因 变 量 . 他 观 
察 了 1074 对 父母 及 某 成 年 子女 身高 的 平均 ,将 所 得 (X,Y ) 值 标 
在 直角 坐标 系 上 ,发 现 二 者 的 关系 近 平 一 条 直线 ,有 如 图 6.1. 总 
的 趋势 是 X 增加 时 YY 倾向 于 增加 一 一 这 是 意料 中 的 结果 .有 意思 
的 是 ,高 尔 顿 对 所 得 数据 作 了 深入 一 层 的 考察 ,而 发 现 了 某 种 有 趣 
的 现象 . 

高 尔 顿 算出 这 1074 个 X 值 的 算术 平均 为 X=68 英寸 (1 英 
寸 为 2.54 厘米 ) ,而 1074 个 Y 值 的 算术 平均 为 Y=69 英寸 , 子 代 
身高 平均 说 增加 了 1 英寸 ,这 个 趋势 现今 人 们 也 已 注意 到 .以 此 为 
据 , 人 们 可 能 会 这 样 推 想 :如 果 父 母 平均 身高 为 a 英寸 , 则 这 些 父 
母 的 子 代 平均 身高 ,应 为 a + 1 英寸 , 即 比 父 代 多 1 英寸 .但 高 尔 
顿 现 察 的 结果 与 此 不 符 :他 发 现 ; 当 父母 平均 身高 为 72 英寸 时 ,他 
们 的 子 代 身高 平均 只 有 71 英寸 ,不 仅 达 不 到 预计 的 72+1=73 黄 
寸 , 肥 而 比 父母 平均 身高 小 了 .反之 , 若 父 母 平均 身高 为 64 英寸 ， 
则 观察 数据 显示 子 代 平 均 身 高 为 67 英寸 , 比 预计 的 64+1=65 黄 
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寸 要 多 . 

高 尔 顿 对 此 的 解释 是 :大 自然 有 一 种 约束 机 制 ,使 人 类 身高 分 
布 保持 某 种 稳定 形态 而 不 作 两 极 分 化 .这 就 是 一 种 使 身高 “回归 于 
中 心 ” 的 作用 .例如 ,父母 身高 平均 为 72 英寸 , 比 他 们 这 一 代 平 均 
身高 68 英寸 高 出 许多 ,“ 回 归于 中 心 ” 的 力量 把 他 们 子 代 的 身高 拉 
回来 一 些 : 其 平均 只 有 71 英寸 ,反比 父母 平均 身高 小 ,但 仍 超过 子 
代 全 体 平 均 69 英寸 .反之 , 当 父 母 平均 身高 只 有 64 英寸 一 一 远 低 
于 他 们 这 一 代 的 平均 值 68, 而 “回归 于 中 心 " 的 力量 将 其 子 代 身高 
拉 回 去 一 些 ,其 平均 值 达 到 67, 增 长 了 3 英寸 ,但 仍 低 于 子 代 全 体 
平均 值 69. 

正 是 通过 这 个 例子 ,高 尔 顿 引 入 了 回归 这 个 名 词 . 现 在 我 们 党 
得 ,高 尔 顿 的 例子 只 反映 了 变量 关系 中 的 一 种 情况 ,在 其 他 涉及 变 
量 关 系 的 众多 情况 中 ,多 不 必 如 此 , 故 拿 这 个 名 称 作 为 变量 关系 统 
计 分 析 的 称呼 , 实 不 见得 恰当 .但 这 个 名 词 现 今 已 沿用 成 习 , 如 硬 
要 改变 , 反 觉 多 此 一 举 了 . 


6.2 一 元 线性 回归 


本 章 我 们 只 讨论 回归 函数 为 线性 函数 的 情形 (包括 能 转化 为 
线性 函数 的 情形 ) 一 一 称 为 线性 回归 .我 们 从 只 含 一 个 自 变 量 X 
( 因 变 量 总 是 一 个 , 记 为 了) 的 情况 开始 , 称 为 一 元 线性 回归 . 这 个 
情况 在 数学 上 的 处 理 足 够 简单 ,便于 对 回归 分 析 的 一 些 概念 作 进 
一 步 的 说 明 . 这 样 , 假 定 回 归 模 型 为 

Y= bop+bX+e (2.1) 
其 中 20,61 为 未 知 参 数 . bo 称 为 常数 项 或 截 距 ,51 则 称 为 回归 系 
数 , 或 更 确切 地 , 称 为 Y 对 X 的 回归 系数 .e 为 随机 误差 ,如 在 6.1 
节 中 已 解释 过 的 ,假定 
E(l(e)= 0,0 < Var(e)=o < oo (2.2) 
误差 方差 o* 未知, 在 6.1 节 中 我 们 曾 解 释 过 这 个 参数 的 意义 及 其 
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现 设 对 模型 (2.1) 中 的 变量 X,Y 进行 了 nn 次 独立 观察 ,得 样 


本 

(X,Y|),(X,, YX (2.3) 
据 (2.1), 这 样本 的 构造 可 由 方程 

Y, 一 bo 十 biAX; 十 eC;,1 一 ] …… , 77 (2 .4) 


来 描述 . 这 里 e; ,是 第 i 次 观察 时 随机 误差 e 所 取 之 值 , 它 是 不 能 
观察 的 .由 于 各 次 观察 独立 及 (2.2) 对 随机 变量 el ,e,,…,e ,有 : 

el,…，,e 独立 同 分 布 ， 

El(e,) = 0,Var(e,) = o°,i = 1,…,7 (2.5) 

以 后 我 们 还 将 进一步 要 求 e; 遵从 正 态 分 布 . 

(2.4) 与 (2.5) 结 合 , 给 出 了 样本 (2.3) 的 概率 性 质 . 它 是 对 理 
论 模型 (2.1) 进 行 统计 分 析 推 断 的 依据 . 以 此 之 故 , 在 统计 学 著作 
中 ,往往 更 着 重 (2.4) + (2.5), 把 它 称 为 一 元 线性 回归 模型 ,而 理 
论 模型 (2.1) 只 起 一 个 背景 的 作用 . 当然 ,理解 (2.4) 和 (2.5) 是 以 
理解 (2.1) 为 基础 的 . 

以 上 的 叙述 是 假定 ,回归 函数 已 依据 某 种 考虑 选 定 了 一 一 在 
此 选 为 线性 形式 .在 实际 工作 中 ,这 当然 是 一 个 要 研究 的 问题 .在 
某 种 稀少 的 场合 下 ,回归 函数 的 形式 可 根据 某 种 理论 上 的 结果 给 
出 .例如 ,从 物理 学 知道 ,在 一 定 温度 (X) 的 范围 内 ,一 条 金属 杆 之 
长 (Y) 大 体 上 为 X 的 线性 函数 .这 时 选择 线性 回归 有 充分 根据 . 
在 多 数 应 用 问题 中 ,不 存在 这 样 充分 的 理论 根据 ,而 在 很 大 的 程度 
上 要 依靠 数据 本 身 . 例 如 , 若 数据 (2.3) 的 散 点 图 呈 图 6.1 的 形状 ， 
则 选 到 线性 回归 哨 数 似 是 妥 当 的 .反之 ,车 散 点 图 呈现 图 6.2(a) 
或 6.2(b) 的 形状 , 则 回归 函数 似 以 取 为 二 次 多 项 式 或 指数 函数 为 
宜 .在 实际 工作 中 ,也 常 使 用 变量 变换 法 . 即 在 散 点 图 与 直线 趋势 
差距 较 大 时 ,设法 对 自 变 量 以 至 因 变 量 进行 适当 的 变换 ,使 变换 后 
的 散 点 图 更 接近 于 直线 ,这 样 就 可 以 对 变换 后 的 新 变量 进行 线性 
回归 分 析 ,再 回 到 原 变量 .在 一 元 的 情况 ,由 于 散 点 图 可 资 参 考 ,在 
回归 上 盟 数 的 选择 上 就 有 较 大 的 操作 余地 . 对 多 元 (多 个 自 变量 ) 的 
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情况 ,问题 就 麻烦 得 多 ,选择 余地 也 较 小 . 


交代 了 这 些 之 后 ,我们 回 到 起 先 的 出 发 点 一 一 (2.4) 和 (2.5). 
今后 总 用 X 和 Y 分 别 记 X 和 YY; 的 算术 平均 .以 前 我 们 曾 指 出 : 
把 自 变量 X 视 为 非 随 机 的 , 故 关 | ,…,X, ,以 及 义 , 就 简单 地 是 已 
知 常数 .因此 ,可 以 把 模型 \(2.4) 改 写 为 

Y;= Bo+PB(X;— X)+e;,i = 1,…,n (2.6) 

Bi = b1,Bo = bo + b1X (2.7) 

故 如 估计 出 了 Bo 和 B1, 则 由 (2.7) 就 得 到 bo 和 6 的 估计 .改写 为 

(2.6) 的 好 处 将 在 以 后 见 到 .这 里 注意 到 一 点 , 即 Bl 后 的 因子 

Xi 一 XX 对 i 二 1,…,n 求 和 为 0. 故 把 (2.4) 改 写 为 (2.6) 有 时 称 为 
模型 的 “中 心 化 ”. 

6.2.1 po 和 有 的 氮 估 计 一 一 最 小 二 乘法 

现在 我 们 要 在 模型 (2.6) 和 (2.5) 之 下 ,利用 数据 (2.3) 去 估计 
Bo 和 Bi. 假定 我 们 用 ao 和 al 去 估计 Po 和 Bl1. 我 们 要 定 出 一 个 准 
则 ,以 衡量 由 此 所 导致 的 偏差 .我们 从 预测 的 眼光 来 看 这 个 问题 ， 


如 用 co 和 ai, 则 回归 函数 Bo+ BI(z 一 匀 ) 将 用 ao+ail(xz 一 外) 去 
估计 之 .利用 它 在 XX, 点 作 预 测 ,结果 为 


Y= aot+ al(X, ~ KX),i = 1,.…,n (2.8) 
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但 我 们 已 实际 观察 到 :在 铸 =X, 处 Y 之 取 值 为 Y,, 这 样 就 有 偏离 
y ,一 了 了 ,7 二 1,…,n. 我 们 当然 希望 这 些 偏离 愈 小 愈 好 :衡量 这 些 
偏离 大 小 的 一 个 合理 的 单一 指标 为 它们 的 平方 和 (通过 平方 去 掉 
符号 的 影响 , 若 简单 求 和 , 则 正 负 偏 离 抵消 了 ): 

Q(av,a1) 一 > (了 一 Y,)? 一 SLY, 一 al0 一 al(CX， -X)]- 


(2.9) 

由 此 考虑 得 出 以 下 的 佑 计 法 则 ; 找 go0,ai 之 值 ,使 (2.9) 达 到 最 小 ， 

以 之 作为 Bo ,PB! 的 估计 .利用 多 元 图 数 求 极 值 的 方法 ,这 只 要 解 方 
程 组 

OQ oN (YY a a(x -XK))=0 (2.10) 


Se = 2 -KX)[Y; -ao ~al(X;- X)]=0 
(2.11) 
由 《2.10) 解 出 ao, 将 解 代 和 (2.11), 解 出 el .我 们 将 这 解 分 别 记 为 
Bo 和 BI: 
(2.12) 


CO) 
SO 
| 


(Xi - X)(Y, - P/O - Xx) 


wD) 
| z 
er 


D(X - DY/ DX, XX)? (2.13) 


“使 (2. 9) 达 到 最 小 ” 个 估计 方 法 ， 称 为 最 小 二 乘法 ,这 个 重要 
的 方法 一 一 角 昌 功 二 入 国信 数学 家 宙 所 有 1799 一 1809 年 间 的 工 
作 “. 这 个 方法 在 数理 统计 学 中 有 广泛 的 应 用 .其 好 处 之 一 在 于 计 
算 简 便 , 且 如 我 们 即将 看 到 的 ,这 方法 导出 的 估计 颇 有 些 良好 的 性 


* 法 国 数学 家 勒 计 德 于 1805 年 发 表 了 这 个 方法 .高 斯 声称 在 1799 年 开始 使 用 这 
个 方法 ,但 见 诸 文字 是 1809 年 . 
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质 .其 中 之 一 是 ,如 从 公式 (2.12) 和 (2.13) 看 到 的 ,估计 量 8. 和 


Bi 都 是 1 Y, 的 线性 函数 ， 即 形 如 Cyl Yi 十 十 Cn Yn 的 消 
数 , 其 中 cl ,… ,ci 都 是 常数 ”. 
利用 模型 的 假定 (2.6),(2.5), 从 公式 (2.12) 和 (2.13) 很 容易 


推出 最 小 二 乘 估计 Bo 和 Pi 的 一 些 性 质 : 


1.8, 和 记分 别 是 Bo 和 Bi 的 无 偏 估计 . 
事实 上 ,由 (2.6) 和 (2.5), 知 EF(Y;)= po+ Bi(X; 一 久 ). 故 


E(Bo) = LE(Y,) 一 工 > [pi 下 Bi(X; -XX] 一 
E(B) = DX RE(Y)/ OX, ) 


= DX; - KBo + P(X, -DC - xX) 


= pl 
2.Bo 和 Bi 的 方差 分 别 为 
Var( Bo) = 点 > Var Y;) = no:/n’ = ao/n (2.14) 


Var( Bi) 一 SX, — X) Vart( Y)/[ Six, -又 )2 


=o/ > (Xi - xX) (2.15) 
i=1 


这 里 用 到 了 Yi ,…, YY 独立 ,Var(cY;)= c2Var( YY,),Var(c+e,) 
=Var(e;)= 0o’,c 为 遂 数 .从 (2.15) 式 我 们 得 到 一 点 启发 .在 第 四 


* 对 8 而 二 ,系数 cu ,cm 与 样本 值 Xi,…X。 有 关 . 但 此 处 我 们 把 X 视 为 非 
随机 的 ,因此 它 不 影响 c,1,…,c, 为 常数 这 个 论断 .车 X 也 是 随机 变量 , 则 情况 就 变 得 
复杂 . 
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况 中 我 们 已 论述 过 ,在 无 偏 估计 中 ,方差 小 者 为 优 ,如 今 B81 为 无 偏 
估计 而 其 方差 与 
S- = >)(X —X) (2.16) 
成 反比 , 故 S2 愈 大 愈 好 . 而 要 S2 大 ,样本 点 XX,,…,X, 必须 尽量 
散 开 一 些 . 这 意味 着 当 X 之 取 值 可 以 由 我 们 选 定 时 ,我 们 不 应 把 
它们 取 在 一 小 范围 内 ,而 最 好 让 它们 跨越 较 大 之 范围 . 当然 ,这 也 
要 有 个 限度 ,不 要 把 试验 点 取 到 没有 实用 意义 的 区 域内 去 . 因为 范 
围 过 大 ,线性 回归 与 实际 回归 函数 的 差距 会 增加 . 
3.Bo 和 Bi 的 协 方差 为 0: 
Cov( Bo, Bi) =0 (2.17) 
事实 上 ,Bo -E(Bo)= 2) (Y;- EY)/n= >) (Yi -BBX - 


奈 ))/n = em, 而 


i=1 


Bi ~ EB1 = D(X KY, ~ EY)/ D(X; — x) 


= > (X; -X)e/ > (X 一 7) 
于 是 ,利用 FE(ex;)=E(e)E(e;)=0 当 1 关 7 ,而 E(e’s)=Var(e,) 
= oz2, 得 


Cov( Bo,B1) =E[(Bo 一 EBo) (BI 一 EB 1)] 


=n 1[ DX, _X)] ‘edxX, -XX)=0 
这 个 性 质 指出 :Bo 和 Bi 不 相关 ( 见 第 三 章 ,定理 3.2 下 面 的 
说 明 ). 它 显示 了 中 心 化 的 好 处 :如 果 考 虑 原 模 型 (2.1) 中 参数 6。， 
bi 的 最 小 二 乘 估计 60,651( 见 下 ), 则 二 者 并 非 不 相关 . 
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由 8o 和 Bi 不 相关 一 般 不 能 推出 它们 独立 (第 三 章 例 3.1). 
但 是 ,如 果 elj，…e, 服从 正 态 分 布 , 则 Yi ，…,y， 也 服从 工 态 分 


布 .B06 和 有 作为 Yi ,…,Y，, 的 线性 函数 ,也 服从 正 态 分 布 * (第 二 


章 例 4.8). 因 此 在 这 种 情况 下 ,由 Bo,PBi 不 相关 可 推出 它们 独立 
( 见 第 三 章 2.3 节 末 尾 ). 


由 B80,B1 的 最 小 二 乘 合计 80, 8 ,通过 变换 (2.7), 即 得 模型 
(2.1) 中 的 50,01 的 最 小 三 乘 估计 分 别 为 


Bo0=Bo- bX= YY- 6bX,6l= A, (2.18) 
它们 分 别 是 po 和 61 的 无 偏 估计 . 利用 上 述 8 ,8， 的 方差 协 方差 
公式 ,不 难 算出 bo,61 的 方差 和 8 及 5, 的 协 方差 ,细节 留 给 
读者 . 

Bo,B1 还 有 些 更 深刻 的 性 质 . 例如 , 若 误差 服从 正 态 分 布 , 则 
它们 分 别 是 8 和 81 的 最 小 方差 无 偏 估计 ( 见 4.3 节 ) .这 个 事实 
的 证 明 超 出 本 书 范围 之 外 . 

6.2.2 残 差 与 误差 和 方差 cz 的 估计 


仍 以 Bo 和 B; 记 Bo 和 8 的 最 小 二 乘 估 计 . 则 在 和 = X; 处 ， 

因 变 量 Y 的 预测 值 为 Y= Bo+ Pi(X’ 一 义 ), 而 YY 的 实际 观察 值 
为 Y, ,二 者 之 差 

6; = Y,— Y,,i = 1,.…,n (2.19) 

残 差 的 作用 有 二 :一 是 当 模 型 正确 时 , 即 (2.5) 和 (2.6) 正 确 


。 更 确 切 地 ,(86,,81) 的 联合 分 布 为 一 维 正 态 分 布 ， 
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时 , 它 可 以 提供 误差 方差 c? 之 一 估计 .理由 很 清楚 :用 Y; 预测 
Y; ,其 精度 取决 于 随机 误差 的 大 小 , 即 误差 方差 的 大 小 ,误差 方差 
愈 大 ,预测 愈 不 易 准 确 , 而 残 差 (绝对 值 ) 就 倾向 于 取 大 值 .反之 则 
倾向 于 取 小 值 . 往 下 我 们 证 明 


二 了 | 1 2 
和 = 了 mp (2.20) 


是 o2 的 一 个 无 偏 估 计 . 
这 胃 这 个 事实 ,注意 


Y;— Y= Bo+Bi(X;— X)+e;-— Bo— BI(X;— X) 
以 及 


po -Bo= PB- Y=B- LNB+B( XN)+te)=— 7 
其 中 e = (el+…e;)/n ,而 
p -有 
= Bi - 2% - X)(Bo + Bi(X; - D+ eo)/ > (X - XY 


=- > (X, -~ X)o/ DO 一 驻 ) 


故 
6;=e—- 6 —(X,- WY - Vol DX) 
平方 ,对 i 二 1,…,n 求 和 ， 注意 
Y (x -XOX -XR)o/ SX -XpP] : 
= (2 (XX)e)) > (x, 一 XxX) 
B30 - 2)(X;— X) = > (x; X)e 
即 得 
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Ve = Mle- ep (DX Roa)/ DX- x): 
:=1 7 二 | 一 i=1 
(2.21 ) 


因为 ej ,…,e, 独立 同 分 布 ,有 均值 0 方差 o, 故 据 第 四 草 例 3.2. 
及 第 三 章 (2.2) 式 ,有 


E(> (e — 2) )= (x -1)o0 
E( > (xX, - X)e) = Var( > (X — X)e;) 
一 Sx — X)*Var(e,) 


= OX -XX) 
以 此 代入 (2.21), 即 得 
E (D0)= (n 一 2)c3 
于 是 证 明了 5 为 的 无 偏 估计 . 
3 3? 称 为 残 差 平方 和 . 其 一 重要 性 质 是 ; 当 。 服从 正 态 分 布 
N(0,o) 时 ,有 有 
六 3 ~ >， (2.22) 


证 明 见 本 章 附 录 A. 注意 自由 度 2 一 2), 它 比 样本 大 小 区 少 2. 这 是 
因为 有 两 个 未 知 参 数 Bo 和 B1 需要 估计 ,用 掉 了 两 个 自由 上 度 ( 参 看 
第 四 章 例 3.2 末尾 处 的 说 明 ). 
残 差 平方 和 有 下 述 便 于 计算 的 表达 式 : 
Do = OY, FBO (XX)Y, 
= > 了 -一 | Sx, -X)Y (2.23) 


7 一】 
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此 式 之 方便 在 于 :在 计算 残 差 平方 和 时 ,一 般 已 先 算 出 了 回归 系数 
Bi 的 估计 PBI 及 立 . 而 在 算 B1 时 ,需要 算出 D(X - 又 )Y , 故 只 


须 再 计算 平方 和 > Y? 即 可 .(2.23) 式 证 明 如 下 : 


> = —Y-—B(X,— XX) 


= DY- 2-24+6 


其 中 B= D3 (Xi- X)= Bi (BO CX, -RX))= PD (X,- 
X)Y ,而 


A = 2 (X — X)(Y; — Y)B1 = B12 (X — X)Y, 

于 是 得 到 (2.23) 第 一 式 . 由 此 得 出 第 二 式 . 

残 差 的 另 一 方面 的 作用 是 用 以 考察 模 

型 中 的 假定 ( 即 (2.5) 和 (2.6)) 是 否 正确 . 

道理 如 下 ;因为 在 模型 正确 时 , 残 差 是 误差 

的 一 种 反映 , 因 误差 e1,…,e, 为 独立 同 分 

布 ,具有 “杂乱 无 章 ” 的 性 质 , 即 不 应 呈现 任 

何 规律 性 .因此 , 残 差 $1,…,6, 也 应 如 此 ， 

如 果 残 差 61,… ,6, 呈现 出 某 种 规律 性 , 则 图 6.3 
本 能 是 模型 中 村 方 耐候 定 与 事实 不 符 的 全 


这 可 能 反映 模型 
(2.1) 中 误差 e 的 方差 与 X 之 什 丰 交 目 随 X 之 值 上 升 而 增加 又 
如 ,设想 回归 函数 为 二 次 函数 , 则 由 图 6.3(/ 为 经 验 回归 直线 ) 可 
看 出 , 当 X; 很 大 或 很 小 时 ,6; 取 正 号 ,而 当 X; 为 中 间 值 时 ,5 取 
负 号 .如 出 现 这 种 情况 ,就 可 以 怀疑 线性 假定 有 问题 . 

这 种 通过 残 差 去 考察 回归 模型 是 否 正确 的 作法 ,叫做 “回归 诊 
渐 . 它 已 发 展 为 回归 分 析 的 一 个 分 支 . 本 书 不 能 仔细 讨论 这 方面 
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的 问题 ,有 兴趣 的 读者 可 参考 陈 希 括 、 王 松 桂 著 《近代 回归 分 析 》 第 
一 章 , 及 张 启 锐 著 《实用 回归 分 析 》 第 四 章 . 
6.2.3 区 间 估 计 和 预测 
本 段 我 们 在 (2.5) 和 (2.6) 的 基础 上 加 上 假定 :误差 。 服从 正 
态 分 布 ,因此 ,现在 (2.5) 强 化 为 
e1,6e2，,"…,en 独立 同 分 布 . e; 一 N(0,07) (2.24) 
先 考 虑 8 .前 已 指出 , 它 是 Yi1,，…,Y,， 的 线性 函数 ,有 均值 8 
方差 c2S--,S2- 见 (2.16) 式 ,因此 
(BI — BI)/AGS-!) ~ N(0,1) (2.25) 
这 个 结果 疝 不 能 用 于 Bi 的 区 间 佑 计 , 因 为 o 未 知 , 按 6.2.2 的 结 
采 , 以 5( 匈 2.20) 人 代替 (2.25) 中 的 c. 可 以 证 明 , 经 过 这 一 代 蔡 , 正 
态 分 布 变 为 1 分 布 (证 明 见 附录 B) 
(B1 — BI)/(6S7!) 一 六 (2.26) 
这 个 结果 就 可 以 用 来 作 B 的 区 间 估 计 或 置信 上 、 下 界 , 因 为 (B1 - 
PB1)A(5S:!) 起 了 枢 轴 变量 的 作用 , 按 4.4 节 中 的 方法 ,得 到 ， 
1. 置信 系数 为 1 一 a 的 BI 的 置信 区 间 , 为 
[8 — Si 2(a /2) ,BI + S71, (a/ 2)] 
2. 置信 系数 为 1 一 a 的 8 的 置信 上 、 下 界 , 分 别 为 
Br + GSilt, (a) 和 BI — dSilt, (a) 
对 截 距 Bo 也 一 样 做 ,也 可 以 由 下 文 对 回归 函数 B06+ Bi(xz 一 久 ) 的 
区 间 估 计 中 , 令 x= 义 得 到 . 
对 回归 函数 mm (x)=po+Bi(z 一 羡 ), 其 点 估计 所 (x)= 色 + 
B1(x 一 外) 也 是 Y1,…,Y, 的 线性 函数 ,因此 在 (2.24) 的 假定 下 ， 


它 也 服从 正 态 分 布 ,其 均值 为 m (xz ), 而 其 方差 和 ^(xz), 根 据 
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(2.24),(2.25), 及 Bo 与 BI 独立 ,为 


A(x) =Var(Bo) + (x — X)*Var(Bl) 
=0(l/n+ (xr - X)»/S?) 

于 是 得 到 ( 访 (z) 一 m(z))AVA(lr)~N(0,1).5 代 go, 可 以 证 明 

(Mr) = mr) A + (x — X) /SY) 一 加- 

(2 .27) 

由 此 得 出 : 

1. 置信 系数 为 1 一 a 的 m(x) 的 置信 区 间 为 

[s(xz) ~ oll/n t+ (一 X) LS (a/2) 
Mm(rX)+a(l/n+(zr ~ X)2[S2)L2t a/ 2)] 

2. 置信 系数 为 1 一 a 的 关 (z) 的 置信 上 下 界 ,分别 为 所 (x) 土 
sl(1/n+ (zr-XX)/S2)1%1,_2(a)(+ 号 为 上 界 ). 

这 个 区 间 之 长 26(1/n+(zx- 关 /S23)1 ?7-2(a/2) 与 + 有 
关 .z 愈 接近 X 样本 的 中 心 X, 则 (z-X) 愈 小 而 区 间 长 度 就 便 
小 .就 是 说 ,在 估计 回归 多数 关 (z) 时 , 愈 靠 近 样 本 X 中 心 点 处 愈 
精确 .这 从 理论 上 指明 了 我 们 在 前 面 提 到 过 的 一 点 事实 : 当 我 们 需 
要 在 自 变 量 X 的 某 个 范围 内 使 用 回归 方程 时 ,应 当 把 观察 点 XX|， 
…,X, 尽量 取 在 这 个 范围 内 .如 
图 6.4,/ 为 由 样本 点 配 出 的 经 验 
回归 直线 ,/| 和 2 分 别 是 p(x) 
的 置信 区 间 上 、 下 端 随 z 变化 时 
划 出 的 曲线 .在 工 轴 上 的 X 附近 
和 /相距 较 近 ,而 当 z 离 X 
人 钝 远 时 ,曲线 愈 分 开 . 如 图 ,在 x 
轴 的 xo 处 , A 点 的 纵 坐 标 是 回 
归 国 数 m (xzo) 的 点 估计 所 (xo)， 
而 A1,A, 点 的 纵 坐 标 , 则 分 别 是 6.4 


”297 ， 


mzxo) 的 置信 区 间 的 上 、 下 两 端点 .曲线 ,ls 只 能 在 这 个 意义 上 
去 理解 ,而 不 能 说 , “理论 回归 直线 落 在 /11,7 之 间 的 概率 为 1 一 
a. 因 为 ,理论 回归 直线 落 在 /1,i; 之 间 , 相 当 于 说 对 一 切 xo 同时 
成 立 :m (zo) 落 在 通过 zo 与 纵 轴 平行 的 直线 在 /0 7: 截 出 的 两 点 
的 纵 坐 标 之 间 ”. 

下 面 来 考察 Y 的 区 间 预 报 . 假定 要 在 自 变 量 X 的 给 定 值 x 
处 预报 Y 之 值 Yo. 前 已 说 过 ( 见 6.1 节 ) ,就 用 疡 (zxo) 作 为 Yo 的 
预报 值 .考虑 差 y= Yo 一 雇 (x0). 它 是 Yi,…,Y, 和 Y 的 线性 函 
数 , 故 仍 为 正 态 分 布 . 因 E(Y0)=m(zro),E[ 摧 (x0)]= m(xo)， 
有 (wn) = 0. 为 考虑 其 方差 ,注意 Yi，Y 和 Yo 独立 , 故 
六 (x0) 与 Yo 也 独立 ,因此 有 

Var(7) = Var( Yo0) + Var( 所 (x0)) 
=o (1 +1/n+ (x -XX)/S) 
仿 以 前 的 做 法 ,用 a 的 估计 值 6 代 替 o, 得 
7 /AG(l+1/n+ (rx —- X)/S)*)~ 1,, 

于 是 得 到 :不等式 

页 (z0) -Gl + 1/n+ (rz -XY/S) ?2 (gj Yo 


(To) + ol+1l/nt+(r si) 


(2.28) 
其 左右 两 端 (所 构造 的 区 间 ) 就 是 Yo 的 置信 系数 为 1 -a 的 区 间 
项 测 .应 注意 的 是 :与 以 前 我 们 讲 过 的 区 间 估 计 不 同 ， 此 处 的 Yo 
并 不 是 一 个 未 知 的 参数 ,其 本 身 也 有 随机 性 . 


* 理论 上 可 以 证 明 : 把 0,42 之 间 夹 出 的 区 域 放 大 一 点 , 即 把 1 往 上 推 一 点 ,1 往 
下 推 一 点 ,就 可 以 满足 这 要 求 ,具体 说 ,应 以 方程 为 y= 所 (zx)+2(1/n+(x- 玉 )2592) 


(2F,.。2(a))3 的 曲线 代替 41, Ls(1i 为 + 号 ). 由 第 二 章 习 题 29 可 知 ,这 个 范围 比 
(2.28) 规 定 的 范围 宽 一 些 . 
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比较 (2.27) 和 (2.28) ,我 们 看 出 m (xo) 的 区 间 估 计 与 Yo 的 
区 间 预 测 的 男 一 点 不 同 之 处 :m (ro) 的 区 闻 估 计 之 长 为 26 (1/n 
+ (zx 一 站/AS2)1?1f_2(a/2). 当 很 大 时 ,6 接近 于 o,f,-， 
(a/2) 接 近 wx, 这 两 部 分 保持 有 界 ”, 另 一 个 因子 中 ,12 一 0. 另 
一 个 因子 ,只 要 试验 点 Xi,…，X, 不 过 分 集中 于 一 处 ,以 使 
> (x _ 坟 ) -> oo ,就 可 以 证 明 (xz 一斑 )2/S2->0( 习 题 5(b)) 这 
样 ,上 述 区 间 之 长 将 随 n 一 eco 而 趋 于 0. Yo 的 区 间 预 测 则 不 然 ， 
其 长 度 表 达 式 中 含 因 子 (1+1A +(z 一 X)AS2 )12. 随 着 7 一 
oo ,其 值 总 大 于 1, 故 不 论 你 有 多 少 样本 ,区 间 预 测 的 精度 仍 有 一 
个 和 界限 .这 个 遭 理 我 们 在 前 面 已 解释 过 :预测 问题 中 包含 了 一 个 无 
法 克服 的 随机 误差 项 . 


6.2.4 假设 检验 


最 有 兴趣 的 假设 检验 问题 是 :检验 原 假 设 
Ho:PI = (2.29 ) 
其 中 <c 是 一 个 给 定 的 常数 ,对 立 假设 为 Ho:B1 关 c. 尤 其 是 c=0 的 
情况 . 估 为 ,B81=0 表示 回归 函数 m (xz) 为 一 常数 8 ,与 过 无 关 . 如 
采 Ho:Bi= 二 0 被 接受 了 , 则 意味 着 我 们 接受 如 下 的 说 法 :所 选 定 的 
日 变量 X 其 实 对 因 变 量 Y 无 影响 , 故 研 究 二 者 之 间 的 关系 也 就 没 
有 意义 了 . 

(2.29) 的 检验 很 容易 利用 (2.26) 作 出 : 

9: 当 |B1 - cj 入 Sm -az(a7/2) 时 接受 Fo, 不然 就 否定 Ho 
(2.30) 


这 个 检验 p 有 水 平 a. 单 边 假设 Bl 志 c, 或 Bl 之 c 的 检验 也 类 似 地 
作出 . 


* 由 于 a 是 随机 的 , 它 只 是 在 “ 依 概率 收 敏 "的 意义 上 接近 c, 故 5 也 有 很 小 的 可 能 
性 远 远 偏离 ao, 其 至 变 得 很 大 .只 是 当 n 很 大 时 这 种 机 会 很 小 . 
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对 截 距 Bo ge 例如 ,Bo =0 的 假设 意味 着 
回归 直线 通过 原点 ,我 们 把 细节 留 给 谈 者 . 
例 1.1 从 条 大 学 男生 中 及 机 而 取 10 名， 测 得 其 身高 ( 米 ) 和 
体重 (公斤 ) 的 数值 为 
(1.71,65),(1.63,63),(1.84,70),(1.90,75),(1.58,60) 
(1.60,55),(1.75,64),(1.78,69),(1.80,65),(1.64,58) 
以 身高 XX 为 自 变 量 ,并 把 它 看 成 非 随 机 的 ,而 以 体重 Y 为 因 变 
量 . 假 定 回归 为 线性 的 .算出 
X =(1.71+1.63 + +1.64)/0 = 1.723 
Y=(65+63+. + 58)/10 = 64.4 
S27 =(1.71 -1.723)? + + (1.64 - 1.7237? 
=0.1062 


10 
> COX XY; = (1.71 -1.723) x 65 + 
;=1 


+ (1.64 — 1.723) x $8 = 5.268 
由 (2.12),(2.13), 得 出 fo 和 有 的 最 小 二 乘 估计 值 分 别 为 


Bo = 64.4,81 = 5.268/ 0.1062 = 49.6 
经 验 回 归 方 程 为 
y = 64.4— 49.6(x — 1.723) =- 21.06 + 49.6x 
当 Zz=1.62 时 Y=59.29. 这 有 两 个 解释 ,一 是 对 身高 为 1.62 米 
的 学 生 ,其 平均 体重 的 点 估计 为 59.29 公斤 ;二 是 如 随机 抽 到 一 个 
学 生 量 出 其 身高 为 1.62 米 , 则 以 59.29 公斤 为 其 体重 的 预测 值 . 
可 按 (2.23) 式 计算 残 差 平 方 和 .为 此 算出 


10 


DY Y)? = (65— 64.4)? + + (58 -64.4)? = 316.4 


会; 


因此 按 (2.23) 式 算出 
10 
26} = 316.4- 49.6 x 5.268 = 54.39 
i=1 


由 此 得 出 误差 方差 o* 的 估计 值 
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6* = 54.39/(10 — 2) =6.799,5 = 2.61 
取 a =0.05. 查 * 分布 表 , 得 1,_;(@a/2)=z8(0.025)=2.306 
于 是 用 (2.27) 和 (2.28), 得 到 回归 哆 数 mx)= Bot+ Bi(x 一 
X) 的 置信 区 间 , 以 及 在 工 点 处 Y 的 取 值 y 的 预测 区 间 , 分 别 为 
(置信 系数 都 是 0.95) 


) 

—21.06+ 49.6x 一 2. 61(0 人 (r= 1 23Y ) X2.306< nm (zx) 

之 -21.06+49.6x+2. 61 (0. 1+ 全 1 23 ) x2.306 

以 及 

-21.06+49.67 -2.61 {1.1+ (1) x2.306<y 
-21.06+49.6z +2.61(1.1+ 7 ) x2.306 


对 x 二 1.62, 上 述 两 个 区 加 分 别 是 
- 21.06 + 49.6z x1.62+2.691 = [56,6,62.0] 
— 21.06 + 49.6z x 1.62 + 6.343 = [53.0,65.6] 
可 见 , 预 测 的 精度 比 估计 回归 函数 的 精度 差 得 多 . 

再 考虑 假设 (2.29) 的 检验 .在 此 例 中 , 取 c=0 是 没有 意义 的 . 
因为 体重 明摆着 与 身高 有 关 ,如 检验 假设 8| = 0, 即 使 接受 了 ,我 
们 也 只 能 妇 因 于 样本 大 小 x 太 小 ,也 不 大 会 认为 8 =0 真 可 以 被 
接受 .可 以 考虑 的 假设 是 c 取 一 个 合理 的 数字 ,例如 c=50,40 之 
类 . “c= 50” 这 个 假设 可 理解 为 :在 另 一 城市 一 所 大 学 曾 作 过 较 大 
规模 的 测量 ,在 那里 比较 确切 地 估 出 8 = 50. 现 在 换 了 一 个 城市 ， 
情况 有 无 改变 ? 由 于 这 样 一 种 提 法 ,县 50 这 个 数字 先天 地 有 一 定 
的 根据 ,在 并 无 比较 显著 的 证 据 的 情况 下 ,我 们 不 愿 轻易 地 认为 
50 这 个 数字 不 适用 于 这 间 大 学 .因此 , 取 一 个 较 小 的 水 平 ,例如 a 
0.05, 就 要 算 比 较 恰当 了 .具体 检验 可 按 (2.30). 算 出 

5S (ax2) = 2.61 x V0.1062 x 2.306 = 1.96 


令 |8-c|=149.6-50| =0.4<1.96, 故 应 接受 原 假设 8, = 50. 
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如 原 假设 为 81 = 52 , 则 被 否定 了 ， 

现在 有 这 样 的 问题 :一 方面 用 我 们 的 数据 估 出 Bi 为 49.6, 另 
-方面 , 按 以 往 资料 可 以 接纳 Bl = 50, 应 取 何者 为 好 ? 这 就 要 分 
析 情 况 ,如果 以 往 资料 可 以 认为 是 与 当前 资料 同 质 的 ,比方 说 ,两 
校 都 是 在 全 国 范围 招生 ,其 学 生 的 地 域 构成 大 体 接近 , 则 有 充分 理 
由 认为 ,当前 的 Bi 与 以 往 的 B81 应 差不多 . 考虑 到 以 往 的 81 是 依 
据 大 量 数据 算出 ,而 当前 的 B81 只 根据 10 个 数据 ,我 们 觉得 , 取 以 
往 的 8 也 许 更 合适 (如 果 B1 = 50 被 否定 , 自 又 当 别 论 ) .反之 ,如 
两 校 都 是 地 方 性 的 ,其 学 生来 源 以 本 地 居多 ,而 两 地 身高 体重 在 关 
系 上 又 有 差别 , 则 我 们 就 可 能 倾向 于 采用 当前 值 了 . 

这 个 例子 也 许 并 不 十 分 典型 ,但 有 关 的 考虑 对 其 他 应 用 问题 
也 是 适用 的 .统计 学 是 一 种 帮助 我 们 对 数据 进行 分 析 的 工具 ,其 应 
用 不 能 脱离 对 实际 问题 的 背景 的 考虑 .不 加 区 别 地 机 械 地 使 用 公 
式 ,难免 导致 与 实际 背离 的 结果 . 


6.2.5 几 个 有 关 问 题 


以 上 我 们 对 一 元 线性 回归 ( 且 随 机 误差 服从 正 态 分 布 的 情况 ) 
的 统计 分 析 作 了 较 仔 细 的 论述 .在 这 一 段 中 ,我 们 提出 几 点 在 使 用 
这 些 方 法 时 值得 注意 的 事情 . 

1. 回归 系数 的 解释 问题 

设想 我 们 建立 了 回归 方程 

y=a+pbr (2.31) 
一 般 地 把 回归 系数 5 的 意义 解释 为 : 当 自 变量 X 增加 或 减少 1 单 
位 时 ,平均 地 说 , Y 增加 或 减少 5 单位. 这 个 解释 对 不 对 ?我 们 
说 ,也 对 也 不 对 ,要 看 具体 情况 而 定 . : 
首先 一 个 问题 是 X 的 变化 区 间 . 在 实际 应 用 中 ,真正 的 回归 
方程 一 般 总 是 与 线性 方程 有 一 定 的 偏离 .在 不 很 大 的 范围 内 ,这 种 
偏离 也 许 不 很 大 ,不 致 对 应 用 造成 影响 .一般 总 是 在 这 个 意义 上 ， 
我 们 把 回归 方程 认定 为 线性 的 . 
日 后 在 应 用 中 ,如 果 自 变量 值 x 超出 了 上 述 范围 , 则 回归 方 
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程 (2.31) 可 能 已 不 再 成 立 . 这 时 X 增加 1 单位 是 否 使 Y 平均 增 
加 5 单位 的 论断 ,也 就 不 能 成 立 了 .例如 , 若 X 为 每 雷 施 肥 量 而 了 
为 每 再 的 产量 . 可 以 相信 ,在 XX 的 一 个 合理 的 范围 内 ,YY 的 平均 值 
大 致 随 X 线性 地 增长 .但 一 超出 一 定 的 范围 ,例如 施肥 量 过 大 时 ， 
进一步 增加 施肥 不 仅 不 能 导致 增产 ,反而 可 能 导致 减产 . 

就 是 日 变 量 之 值 处 在 合理 的 范围 内 时 ,回归 系数 意义 的 解释 
仍 可 能 有 问题 . 分 两 种 情况 来 讨论 . 一 种 情况 是 X 之 值 在 试验 中 
可 由 人 指定 (如 上 述 施 肥 量 ). 这 时 ,只 要 在 日 后 的 应 用 中 情况 与 你 
建立 回归 方程 时 大 体 相 同 这 主要 指 的 是 X 以 外 的 因素 对 YY 
的 影响 要 相当 , 则 上 述 解释 , 即 XX 增 减 1 单位 时 Y 平 均 增 减 5 单 
位 ,是 正确 的 ,否则 就 不 见得 正确 . 仍 拿 上 面 那个 例子 来 说 ,设想 在 
建立 方程 (2.31) 而 进行 的 试验 中 ,所 用 的 田地 都 是 底肥 很 不 充足 
的 ,而 日 后 你 把 它 用 到 底肥 很 充足 的 田地 上 ;或 者 ,在 试验 中 用 的 
是 深 耕 ( 这 对 肥料 吸收 有 利 ), 而 日 后 用 到 浅 耕 的 田地 上 , 则 结果 就 
不 见得 正确 .了 . 

如 果 自 变量 X 是 与 Y 一 起 观察 所 得 ,而 不 能 事先 由 人 控制 ， 
则 情况 更 加 复杂 .在 这 种 情况 下 ,除了 满足 X 必须 处 在 合理 范围 
内 这 个 限制 外 ,还 必须 注意 ,X 值 必须 是 在 “自然 而 然 地 ”产生 而 
不 是 人 为 地 制造 出 来 的 情况 下 ,上 述 解释 才 有 效 . 举 一 个 极端 的 例 
子 . 设 把 X 作为 体重 而 Y 作为 身高 , 则 在 X 一 定 的 范围 内 , 仍 可 
建立 线性 回归 方程 (2.31), 比方 说 ,=0.02. 这 意味 着 体重 每 增 
减 1 公斤 ,号 高 平均 约 增长 2 厘米 .假如 你 观察 一 个 正在 长 身体 的 
育 年 人 ,在 某 时 刻 你 量 得 他 体重 X 为 52 公斤 ,身高 158 厘米 .过 
奉 干 时 候 他 体重 长 到 54 公斤 ,你 预测 他 身高 162 厘米 左右 ,这 个 
用 法 正确 . 因为 你 只 是 一 个 被 动 的 观察 者 ,并 未 设法 去 影响 这 个 进 
程 .有 反之, 如果 你 用 强力 减肥 法 使 一 个 胖子 在 两 星期 内 体重 下 降 5 
公斤 ,而 预测 他 身高 将 下 降 10 厘米 左右 , 则 型 伯 不 见得 正确 .因为 
X 值 的 改变 出 于 你 人 为 的 干预 ,违反 了 X,Y 之 间 的 关系 的 自然 
进程 .再 举 一 个 例子 :统计 资料 显示 人 的 文化 水 平 的 提高 导致 出 后 
率 降 低 . 但 如 某 个 国家 孤立 地 进行 提高 人 的 文化 水 平 的 工作 ,就 不 
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一 定 能 导致 出 生 率 预期 的 降低 . 这 是 因为 人 口 出 生 率 是 由 一 系列 
的 经 济 社 会 和 文化 习惯 等 条 件 决 定 的 . 单 抽出 文化 水 平 这 个 因子 ， 
其 实 是 将 它 作 为 一 个 综合 因子 来 看 待 . 故 如 它 的 改变 确实 是 显示 
了 这 种 综合 条 件 的 改善 , 则 应 有 利于 出 生 率 的 降低 .反之 ,如 果 其 
他 条 件 ( 经 济 .社会 等 ) 并 无 改变 甚至 有 了 恶化 ,而 只 孤立 地 提高 文 
化 这 个 因子 , 则 背离 了 建立 回归 方程 的 前 担 了. 
2. 回归 方程 的 外 推 
所 谓 外 推 , 就 是 在 建立 回归 方程 时 
所 用 的 日 变量 数据 的 范围 之 外 去 使 用 回 
归 方 程 ( 如 有 果 在 自 变 量 数据 的 范围 之 内 
使 用 ,就 叫做 内 捅 ) .一般 都 是 不 主张 对 
回归 方程 作 外 推 使 用 的 ,原因 我 们 在 以 
前 已 提 过 了 , 即 理论 上 回归 方程 一 般 并 
。 非 严 格 的 直线 . 例如 ,回归 方程 是 曲线 
/ ,如 有 果 你 在 < 委 z 委 ”这 个 范围 内 使 用 ， 
则 直线 2 可 充分 好 地 代表 它 ,但 如 外 推 至 c 点 , 则 与 实际 情况 有 
较 大 的 差距 了 (图 6.5). 
当然 ,也 不 能 说 外 推 在 任何 情况 下 都 不 行 .在 其 种 很 特殊 的 情 
交 下 ,回归 方程 为 线性 这 一 点 有 充分 的 理论 根据 ,这 时 外 推 应 不 致 
导致 太 大 的 偏差 .其 次 ,如 外 推 距 离 不 太 远 ,问题 一 般 也 不 会 很 大 . 
在 没有 把 握 而 情况 允许 时 ,可 以 做 一 些 试验 ,以 考察 一 下 回归 方程 
在 拟 应 用 的 范围 内 符合 的 程度 如 何 . 
3. 回归 方程 不 可 逆转 使 用 
在 日 变量 XX 和 因 变 量 Y 都 是 随机 的 场合 ,往往 可 以 把 其 中 任 
一 个 取 为 自 变量 .人 的 身高 体重 就 是 一 个 例子 .这 时 就 存在 两 个 回 
归 方 程 ,如 都 为 线性 的 , 则 分 别 有 形 状 
y=at+br, r=ct+dy (2.32) 
有 趣 的 是 ,这 两 个 方程 并 不 一 致 .意思 是 , 若 你 把 (2.32) 的 第 一 个 
方程 y= 二 a -+ bx 对 x 解 出 得 x 二 -a/b+ yb, 则 这 方程 不 一 定 就 
征 (2.32) 第 二 个 方程 ,对 实际 数据 配 出 的 经 验 回归 直线 ,也 是 这 个 
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情况 . 设 有 了 数据 (Xi1,Y1),…, (X,Y ), 把 作为 自 变量 配 出 
回归 方程 (用 最 小 二 乘法 ,下 同 )y= + bx ,与 把 Y 作为 自 变 景 配 


出 的 回归 方程 zx=t+ dy 不 一 定 相同 ,上 是 -- 般 不 相同 ， 

因此 ,在 人 的 身高 (六 ) 体 重 (Y) 这 个 例子 中 ,如 你 的 目的 是 通 
过 身高 预测 体重 , 则 你 应 取 Y 为 因 变 量 , 以 建立 回归 方程 y=a + 
bz. 如 果 什 么 时 候 你 忽然 需要 通过 体重 预测 身高 , 则 你 并 不 能 利 
用 上 述 方程 去 作 ,而 必须 从 头 做 起 , 取 X 为 因 变 量 ,用 最 小 二 乘法 
配 出 方程 xz=cr+cy. 后 一 方程 用 于 从 v 预测 z. 

表面 上 看 这 一 点 颇 使 人 感到 难以 理解 , 细 想 之 下 ,道理 其 实 不 
难 . 为 方便 计 , 设 (X,Y) 的 联合 分 布 为 二 维 正 态 分 布 N(a ,6b ,oli， 
03,p), 则 如 在 第 2 章 ( 见 该 章 (3.10) 式 ) 中 所 证 明 的 ,Y 对 X 的 回 
归 方 程 为 


(y—5b) = 00201 (XT ~ a) (2 .33) 
而 六 对 YY 的 回归 方程 则 为 
(x—a)= oo1o3'(y— 6b) (2 .34) 


除非 上 “=1, 即 X,Y 之 间 有 严格 的 线性 关系 ,(2.33) 与 (2.34) 不 
一 样 , 因 为 ,由 (2.33) 得 (x -a)=p ojo7!(v-65)， 除非 p=1, 
这 与 (2.34) 不 同 .这 样 看 来 ,理论 上 这 二 者 本 不 一 致 .因此 ,由 数据 
所 配 出 两 个 经 验 回归 方程 ,也 不 会 一 致 了 . 

这 个 论点 从 理论 上 说 清楚 了 问题 .但 在 直观 上 ,人们 可 能 仍 觉 
得 有 些 难以 理解 . 为 说 明 这 一 点 ,考察 这 样 -个 情况 :相关 系数 
2 之 0 但 很 小 .这 时 ,X,Y 有 些 关系 ,但 关系 很 微弱 :一 者 的 变化 只 
引起 为 一 者 很 小 的 变化 . 因此 ,在 两 个 回归 关系 y=a+bzr 和 >= 
c+ dy 中 ,系数 5,d 都 很 接近 0. 这样 二 者 就 必然 不 一 致 了 . 因由 
y=a+ bz 得 出 x=al+ bivy, 其 中 61=6 i.b) 很 大 ,因为 5 很 
小 , 故 bt 不 可 能 与 wd 一 致 . 

但 应 注意 :我 们 强调 回归 方程 不 能 逆转 使 用 是 指 用 于 预测 市 
育 , 如 用 于 控制 则 另 当 别论 .比如 ,建立 了 YY 对 X 的 回归 方程 y= 
a + Px. 为 要 把 Y 之 值 控制 在 yo 使 其 误差 尽量 小 ,和 白 变 量 X 应 取 
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何 值 ? 那 要 从 yo 二 a + 6x 解 出 x= (yo 一 &a)/6. 当然, 用 于 控制 的 
情况 应 当 是 自 变 量 X 之 值 能 由 人 选择 时 ,这 时 不 存在 作 X 对 了 
之 回归 的 问题 . 

4. 在 本 节 的 讨论 中 ,我 们 都 是 在 自 变量 X 为 非 随机 的 假定 
下 进行 的 . 而 在 应 用 中 ,又 不 时 遇 到 X 也 是 随机 的 情况 ,而 我 们 也 
就 当 作 X 为 非 随机 , 仍 使 用 本 节 导 出 的 公式 ,这 样 做 在 理论 上 到 
底 可 以 不 可 以 ? 

这 问题 的 仔细 分 析 比 较 复杂 ,不 能 在 这 里 详细 给 出 了 .我 们 只 
指出 两 点 :一 是 若 (X, Y) 的 联合 分 布 为 二 维 正 态 N (a ,6b,o?,0o3， 
0), 则 有 关 回 归 系 数 的 点 估计 ,区 间 估 计 , 回归 函数 的 区 间 估 计 与 
区 间 预 测 , 回 归 系 数 的 检验 等 公式 ,全 都 合用 ,但 $1,8, 的 方差 公 
式 已 不 适用 (B1 的 方差 表达 式 中 含 Xi ,因此 处 X 也 是 随机 变量 ， 
这 是 不 可 以 的 ). 52 仍 是 模型 (2.1) 中 的 误差 e 的 方差 的 无 偏 估 
计 , 但 这 个 方差 应 是 给 定 X 时 了 的 条 件 分 布 之 方差 , 即 c3(1 - 
o 护 )( 见 第 二 章 (3.9) 式 ). 因 此 在 这 一 场合 , X 为 随机 变量 并 不 影 
响 方 法 的 使 用 .我 们 之 所 以 能 不 顾 X 是 否 随 机 而 使 用 本 节 导 出 的 
公式 ,主要 就 是 基于 这 个 理由 .二 是 若 (X,Y) 的 分 布 不 是 正 态 时 ， 
虽说 回归 系数 点 估计 的 公式 仍 可 用 ,但 其 他 一 切 已 不 再 成 立 了 . 


6.3 多 元 线性 回归 


本 广 我 们 考虑 有 p 个 自 变量 Xi,…,XX, 的 情形 , 因 变 量 仍 记 

为 Y. 模 型 为 
Y = bot+ bIXI1+*** + bpXyp+e (3.1) 
其 解释 与 (2.1) 相 同 .这 里 也 有 自 变 量 为 随机 或 非 随机 的 区 别 , 今 
后 我 们 一 律 把 自 变 量 视 为 非 随机 的 .在 (3.1) 式 中 ,6o 为 常数 项 或 
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截 距 ,6b 称 为 了 对 Xi 的 回归 系数 ,或 称 仿 回归 系数 .e 仍 为 随机 
误差 . 

现 设 对 Xi,…,X, 和 YY 进行 观察 ,第 i 次 观察 时 它们 的 取 值 
分 别 记 为 X]1;,… ,六 和 YY;, 随 机 误差 为 e;( 注 意 e; 不 可 观察 ), 则 
得 到 方程 

Yi = bo0+ OIXE + + bX + eisi 1 (3.2) 

这 里 假定 

el ……,e, 独立 同 分 布 ,El(e,) = 0,0 <Varle)=0o < oo 


(3.3) 
误差 方差 c* 未 知 . 
统计 问题 仍 和 一 元 回归 时 一 样 ; 要 根据 所 得 数据 
(XDA (3.4) 


对 50,…,b。 和 误差 方差 o* 进行 估计 ,对 回归 了 肾 数 bo + bjxri +… 
bpxp 进行 估计 ,在 自 变量 的 给 定之 值 (x9,…, .x9 ) 处 对 因 变 量 Y 
的 取 值 进行 预测 ,及 有 关 的 假设 检验 问题 等 .在 上 节 中 对 一 元 情况 
引进 的 不 少 方法 和 概念 仍 适 用 于 此 处 多 元 的 情况 ,但 在 计算 和 理 
论 方面 ,都 较 一 元 的 情况 复杂 .就 本 课程 而 言 ,我 们 不 能 对 这 些 进 
行 仔细 的 论述 ,只 能 把 一 些 重要 的 结果 和 公式 不 加 证 明 地 写 出 来 . 
在 讨论 一 元 的 情况 时 我 们 曾 实行 “中 心 化 ”, 即 用 (2.6) 人 代替 
(2.4). 这 一 变换 对 多 元 的 情况 很 有 用 ,方法 也 一 样 :算出 每 个 自 变 
量 从 在 nn 次 观察 中 取 值 的 算术 平均 X， 一 (Xl 十 … 十 Xin /nn , 而 
后 令 

XE = Xi- Xisi = 1 nk = 1,.…,p (3.5) 

即 可 将 (3.2) 写 为 
Y;= Bo+BIXi t+ BX t+e,i= 1,%,n (3.6) 


* 这 " 偏 " 字 的 意思 ,约略 与 微 积分 中 偏 导数 中 的 “ 偏 " 字 相当 ,其 真实 含义 是 : 若 只 
取 … 个 自 变量 Xi 而 考虑 Y 与 Xi; 之 间 的 一 元 回归 , 则 回归 系数 b? 将 与 (3.1) 中 的 b 
不 同 ， 
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Be 等 与 5 等 的 关系 是 : 

Be = besk = 1 piBo = bot bX + + bX, (3.7) 
如 在 模型 (3.6) 之 下 对 Bi 等 作 了 估计 , 则 可 用 (3.7) 将 其 转化 为 对 
pb: 等 的 估计 .在 (3.6) 中 有 

Xi + tt XE = 0,k = 1,.,p 
以 后 我 们 只 讨论 (3.6), 有 是 为 书写 方便 计 , 略 去 Xi 中 的 “* ”号 , 即 
仍 记 为 X,: 
Yi; = Bot BXii t+ PoXp +esi=1,……,n (3.8) 

记 住 (3.8) 中 的 Xi 已 是 经 过 中 心 化 的 ,与 (3.2) 中 的 Xe 不同. 

在 讨论 多 元 线性 回归 时 ,采用 和 矩阵 和 向 量 的 记号 很 方便 . mm 
行列 的 矩 泗 常用 一 个 大 号 字母 (如 XX,A 等 ) 去 记 , 有 时 也 记 为 
(ai ) ,4s 为 该 窍 阵 的 (7,j) 元 , 即 第 i 行 第 ) 列 之 元 . 当 关 =2 时 
称 为 2 阶 方 阵 . n 阶 方 阵 4 = (cy ) , 若 咏 二 1, 当 72=J,ai=0 当 
1 天 1, 则 称 为 2 阶 单位 阵 并 记 为 了 或 工 . 方 阵 A 的 道 方 阵 (如 存 
在 ) 记 为 A .和 矩阵 A 的 转 置 矩 阵 将 记 为 A 

问 量 a 一 般 理 解 为 列 向 量 ,如 


为 上 维 列 向 量 ,a; 为 其 第 i 个 分 量 .a 则 是 行 向 量 (al,…,aj). 在 
矩阵 或 向 量 运 算 中 ,0 表示 各 元 皆 为 零 的 矩阵 或 向 量 , 有 相应 的 维 

在 A 为 m Xn 方 隆 ,a 为 nn 维 向 量 , 则 按 和 矩阵 乘法 定义 ,Aa 
为 x 维 向 量 , 当 A 为 n 阶 方 阵 , 击 a 为 n 维 向 量 时 ,a Ac 是 一 个 
数 , 这 形式 称 为 二 次 型 . 一 般 在 讨论 二 次 型 时 总 假定 A 为 对 称 方 
阵 , 即 其 (1 ,站 元 等 于 其 (j ,站 元 ,或 4=A ， 


6.3.1 最 小 二 乘 估 计 


与 一 元 的 情形 一 样 , 令 
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| > 
Q(ao,01, ,ap) 一 2, (CY.; — ao0—AXiiat—…— Xman ) 


了 -二 


后 找 a0,…,as 之 值 , 记 为 B60,…, Bs, 使 上 式 达 大 到 最 小 . B; 等 就 
是 等 的 最 小 二 乘 估 计 . 作 方程 
3aQvau = 0,3aQvau = 0,…,3aQ/aa, = 0 


并 加 以 简单 的 整理 , 即 得 


7Q0 一 > Yj; , 解 为 Bo = YY (3.9) 
i=1 
lliai t+ li2a2 十 十 Loxp = > XY 
.vv . (3.10) 
Lp1Q1 十 [p202 十 "十 [pp p = > XY, 
i=1 
此 处 1， = >》 XX,; .车 引 进 以 下 的 矩阵 和 向 量 * 
i=| 
Xi XI Xl (lr lt hip 
XXX ly 7 1 
人 二 | 人 21 2 2 = 21 2p (3.11) 
| 
(Xl Np2 A lp Lp2 “°° {pp 
YI pb Bi 忆 
Y (07) = : ;P= : , B= » a = | : 
Y) Lp lh Lu 
则 元 =XX ,方程 组 (3.10) 右 边 各 元 分 别 是 向 量 XY(oa 的 相应 元 
于 是 方程 组 (3.10) 可 简写 为 
La = XY,,, (3.12) 


方程 组 (3.10), 即 (3.12), 称 为 正则 方程 .其 解 , 即 8 的 最 小 二 乘 
。 人 征 阵 X 称 为 设计 矩阵 ,但 -- 般 设计 搜 阵 是 指 末 经 过 中 心 化 的 ,由 原来 的 X; 所 构 
成 的 短 阵 . 
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估计 ,可 表 为 
B= L XY,,) (3.13) 


1.80,8 分 别 是 8, 和 8 的 无 偏 估 计 . 
2.Cov(Bo,B;)=0,j=1.…,p, 即 Bo 与 每 个 包 都 不 相关 


3.Var(Bo)==o?/n; 若 记 
C= (c)= LL (3.14) 


则 Var( Bj) = co2,Cov( 记 , 房 )= cao?. 由 于 这 个 性 质 , 方 阵 上 1! 在 
回归 分 析 中 有 很 大 的 重要 性 ,一 般 者 需要 算出 来 .不 然 的 话 , 解 方 
程 (3.10) 可 用 通常 的 消 元 法 更 简便 ,而 无 须 用 (3.13). 


6.3.2 误差 方差 的 估计 
仍 如 -元 回归 一 样 ,定义 残 差 


6:= Yi (Bot XB1+t + XpB,) ,i= 1 (3.15) 
及 残 差 平方 和 6T+…+ 人 2. 可 证 明 
5* = (0i+ +22)A 一 六 -1 (3.16) 


是 o7 的 一 个 无 偏 估计 . 
当 随 机 误差 服从 正 态 分 布 时 ,可 证 明 > 183 /oz 服从 自由 度 


7 一 万 一 1 的 和 分 布 .这 里 有 p+l1 个 参数 Po, Bi,.:,P, 要 估计 , 故 
自由 度 减 少 了 户 +1. 

对 此 处 多 元 的 情况 ,类 似 于 (2.23) 式 的 结果 也 成 立 : 
P= DY (PDXY, tt BS XY) 
= ;=1 i=1 


1 7 二 1 


了 


(3.17) 


、， 证明 见 习题 7. 
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此 式 的 方便 之 处 在 于 :(3.17) 右 边 括号 内 的 各 项 ,在 列 出 正则 方程 
组 (3.10) 时 已 算出 了 ,而 在 估计 go? 时 ,一 般 先 估计 B , 故 Pi，…， 
B, 等 也 已 算出 了 . 

6.3.3 区间 估 计 与 预测 


在 作 区 间 佑 计 和 预测 时 ,要 假定 随机 误差 服从 正 态 分 布 , 即 要 
把 (3.3) 加 强 为 : 
el1，,"…,e, 独立 同 分 布 ,e 一 N(0,0:),i = 1,.…,7n (3.18) 


这 时 , 因 B06,…,B, 都 是 YN，… Y, 的 线性 函数 ,它们 都 服从 正 态 
分 布 . 

1. 回归 系数 8 的 区 间 估 计 

已 知 FE(B)=B,Var(B)= co?, 故 有 (BB 一 B)AV 50)~ 
N(0,1). 以 o 的 合计 5 代替 上 式 中 的 go, 则 可 以 证 明 


(8 — PB) AG Veo) ~ ty (3.19) 
与 一 元 情况 相似 ,由 此 就 可 以 作出 8 的 区 间 估 计 


Bi -6 Ve pi(a/ 2) SB EB +o Vot, ,1(a/ ?2) 
(3.20) 

置信 系数 为 1 - a. 类 似 地 作出 B 的 置信 上 .下 界 ， 

2. 回归 通 数 的 区 间 估 计 

仍 记 回归 函数 为 

n(x)= Bo 十 BI1(x1 一 Xi) 十 …* 十 Pol xp 一 X,) 

Xi 的 意义 前 已 指出 ,为 Xi 三 ( Xe 十 Xin)/n, r= (x,, 
rp) 


DZ) 的 点 估计 为 
mm(r) 一 Bo 十 BI1( zi — XI) 十 十 Bol zy — X,) 


其 期 望 值 为 m (zx). 其 方差 可 根据 86,…,B, 的 方差 与 协 方差 算 
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出 ,结果 为 


\ 

A*(x)o- = [= 十 2 (x; 一 X;) (x 一 Xi) ci ja 
于 是 得 到 ( 雇 (z)-m(z))A4(zx)o)~N(0,1). 以 3 代替 6, 得 到 
(P(r) om(r))/(A(r)E)~ 1 1 (3.21 ) 


由 此 就 可 作出 (zxz) 的 区 则 估 计 为 
mr) 一 2(Zz)to Ca/ 2) 
< MOz) 雪 六 (Cr)+OZ)b ICa 2) (3.22 ) 
置信 系数 为 1- a. 
在 (3.22) 式 中 令 zi=…=zo=0, 得 到 原 模型 (3.2) 中 的 党 数 
项 bo 的 区 间 估 计 . 
3. 在 自 变量 的 值 zo= (x10,… ,zy0) 处 预测 因 变 量 Y 之 取 值 
.0 
作为 点 预测 ,就 用 所 (xo). 其 区 间 预 测 与 回归 水 数 区 间 估 计 
的 差别 ,就 在 于 方差 多 了 一 个 o“, 故 只 须 把 (3.22) 式 中 的 A(z) 改 
为 vy 1+A2- (xzo) 即 可 : 
(Xx0o)— GV1t+ A-(xo)t, pi(ar 2) 
A) roVTT A » 1(a/2) (3.23) 


其 置信 系数 为 1 一 a. 
6.3.4 假设 检验 问题 


在 多 元 回归 中 , 因 包 含 了 多 个 回归 系数 ,可 以 考虑 的 假设 检验 
问题 , 比 一 元 情况 要 多 些 .本 段 仍 要 假设 随机 误差 服从 正 态 分 布 . 

1. 单个 回归 系数 8 的 检验 

考虑 原 假设 Ho:B=c,c 为 给 定常 数 ,利用 (3.19) ,仿照 一 元 
情况 的 处 理 方式 ,得 1 检验: 


当 |8 一 c| 之 5 Vot,_sp1(a/2) 时 接受 Ho, 不 然 就 否定 H。 


(3.24) 
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类 似 地 可 考虑 单 边 假设 8 委 c 或 8>>ec 的 检验 问题 . 

在 应 用 上 ,主要 考虑 的 -- 种 情况 是 c=0. 如果 假 设 B;=0 被 
接受 , 则 可 能 解释 为 : 自 变量 X 对 Y 无 影响 ,因而 可 以 从 回归 涪 
数 中 删 去 .但 这 种 解释 要 慎重 .一 则 是 样本 可 能 太 少 ,二 则 还 有 其 
他 原因 , 见 6.3.5. 

2. 全 体 回 归 系 数 皆 为 0 的 检验 

即 原 假 设 为 

Ho:B1 = P=" =P,=0 (3.25) 
这 个 假设 的 检验 常 称 为 “回归 显著 性 检验 ,其 意思 如 下 : 阁 (3.25) 
通过 了 , 则 有 可 能 ,所 选 的 自 变 量 Xi,…，,X， 其 实 对 因 变 量 Y 无 
影响 或 影响 很 小 .这 样 , 配 出 的 经 验 回归 方程 也 就 没有 多 大 意义 . 
在 实用 上 ,这 有 两 种 和 情况 ;一 是 确实 81,…,PBs 都 为 0 或 很 小 ,这 时 
我 们 选 错 了 自 变 量 ;-- 是 样本 太 少 ,随机 误差 的 干扰 太 大 ,以 致 各 
日 变量 的 作用 显示 不 出 来 .到 底 是 哪 种 情况 ,当然 须 得 对 具体 问题 
作 上 有 具体 分 析 . 但 无 论 如 何 , 如 果 假 设 万 被 接受 , 则 总 是 显示 ,由 数 
据 配 出 的 经 验 回归 方程 不 理想 ,不 宜 运 直 用 于 实际 ， 

反之 ,在 Ho 被 否定 , 则 这 说 明了 :所 选 定 的 自 变 量 X|,…， 
X) ,对 因 变 量 Y 硝 有 一 定 的 影响 ,并 非 无 的 放 矢 .通常 把 这 说 成 
回归 达到 了 显著 性 ,并 进而 引伸 解释 为 :所 配 的 回归 方程 成 立 ,可 
以 有 效 地 使 用 了 .这 样 的 解释 还 需 慎重 ,因为 检验 的 结果 只 是 告诉 
我 们 :所 选 和 目 变 量 中 ,至 少 有 一 部 分 是 重要 的 ,但 也 可 能 尚 留 有 并 
非 重要 的 ;尤其 是 ,并 不 能 排斥 遗漏 了 其 他 重要 因素 的 可 能 性 .这 
一 切 要 看 前 期 工作 做 得 如 何 , 不 能 都 委 之 于 这 个 检验 .我 们 认为 ， 
这 个 检验 的 基本 意义 是 事后 验证 性 的 :研究 者 在 事前 根据 专业 知 
识 及 经 验 , 认 为 已 把 较 重 要 的 自 变 量 选 入 了 ,是 在 一 定 的 误差 限度 
内 ,认为 回归 函数 可 取 为 线性 的 .经 过 试验 得 出 数据 后 ,他 可 以 通 
过 这 个 检验 验证 一 下 ,原来 的 考虑 是 否 有 毛病 .这 时 ,车 Ho 被 否 
定 , 他 可 以 合理 地 解释 为 :数据 与 他 事前 (试验 前 ) 的 设想 并 不 矛 
盾 . 反 之 ,车 Ho 被 接受 , 则 提醒 他 ,也许 他 事前 的 考虑 有 欠 周 到 之 
处 ,值得 再 人 研究 一 下 . 
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这 里 所 谈 的 实质 一 小 及 -个 选择 回归 日 变量 的 问题 .在 一 项 
大 型 的 研究 中 ,看 来 与 因 变 量 Y 有 关 的 因素 往往 很 多 ,而 在 回归 
方程 中 却 只 宜 选 进 一 部 分 关系 最 密切 的 ， 选 多 了 反而 不 好 .前 面 我 
们 强调 专业 知识 和 经 验 在 处 理 这 个 问题 中 的 作用 ,但 这 并 不 排斥 
统计 分 析 的 作用 .实际 上 ,回归 自 变量 的 选择 问题 是 回归 分 析 中 很 
受 重 视 的 一 个 计 题 , 近 30 年 来 出 现 了 大 量 的 工作 .这 些 在 本 书 中 
无 法 细 述 了 ,有 兴趣 的 读者 ,可 参看 陈 希 插 和 王 松 桂 所 著 《 近 代 回 
归 分 析 》 的 第 三 章 . 

现在 我 们 回 到 假设 (3.25) 的 检验 问题 .我 们 只 能 解释 一 下 导 
出 检验 的 思想 ,而 不 能 仔细 证 明 其 中 所 涉及 的 分 布 问 题 . 
前 面 我 们 在 原 模型 (3.8) 之 下 算出 了 残 差 平方 和 (3.17), 其 值 
暂 记 为 RI. 现 如 假设 (3.25) 成 立 , 则 无 异乎 说 我 们 采纳 新 模型 
Y;= Bo+ei,i 三 上 7 (3.26 ) 
在 R; ,结果 为 


放出 天 据 对 模型 [26 的 维 全 各 族 决 人 优 于 其 对 (3 8) 的 扫 
合 程度 ,因为 (3.8) 中 可 供 选择 的 余地 比 (3.26) 大 .但 拟 合 程度 相 
差 多 少 , 则 取决 于 模型 (3.26) 是 否 正 确 , 即 假设 (3.25) 是 否 成 立 . 
奋 (3.26) 正 确 , 则 差距 要 小 些 ,否则 就 大 些 ”. 这样 ,R， 和民 之 差 
R; 一 Ri 可 作为 假设 Ho 正确 性 的 一 种 度量 :R; 一 Ri 愈 小 ,Ho 愈 
像 是 成 立 .理论 上 可 以 证 明 : 当 Ho 成 立时 有 


三 (Ry 一 RD) 一 她,R3 - Ri 与 人 2 独立 
这 样 ,再 注意 当 随机 误差 服从 正 态 分 布 时 有 


“种 直观 的 想法 ,其 根据 在 于 :与 数据 拟 合 最 好 的 模型 ,是 在 真 模型 附近 而 
六 -好 宁远 离 它 (这 并 非 不 可 能 ) ,出 表示 经 验 铝 好 方程 与 理论 回 寻 方程 莽 
距 很 大 ,整个 分 析 就 没有 多 大 意义 了 . 
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(nC—pC— 1)5°/o° 一 x -p-l1 
本 是 ,由 下 分 布 的 定义 , 知 当 原 假设 Ho 成 立时 有 

ps (Ra ~ RI)/S: 一 Fy np-l (3.28) 
按 (3.27) 和 (3.17), 得 


Ry— RI = BD XY + +PB, DXyY: (3.29) 


7 一 1 | 


导 到 (3.2S) 的 Ho 的 下 述 检验 法 : 
aa 


疡 ; 
不 然 就 否定 Ho (3.30) 
检验 水 平 为 a. 这 个 检验 称 为 Ho 的 下 检验 . 
3. 一 部 分 回归 系数 为 0, 即 
Hi:8 = =8=0 (ry) (3.31) 
检验 的 背景 是 :全 体 自 变量 按 其 性 质 分 成 -- 些 组 ,而 X1,…， 
X, 是 反映 某 方面 性 质 的 因子 .(3.31) 的 意义 是 :这 方面 的 因子 其 
实 不 影响 因 变 量 Y 之 值 . 
检验 方法 与 (3.25) 同 :以 R3; 记 当 (3.31) 成 立时 的 残 差 平方 
和 , 即 
Ri= min > (Yi -ao- Xiar1 一 Xoiap) 


然后 ,可 以 证 明 ; 当 随机 误差 服从 正 态 分 布 而 Ho 成 立时 ,有 
二 (Ri -RD)/G ~ F,, ,i 
于 是 得 到 (3.31) 的 下 述 检验 法 : 
当 二 (RS - RD 之 下, p41(a) 时 接受 Ho 不 然 就 否定 蕊 


(3.32) 
检验 水 平 为 a. 这 个 检验 通称 为 假设 (3.31) 的 下 检验 .称呼 的 来 
由 显然 是 ,所 用 的 检验 统计 量 有 下 分 布 . 
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直接 计算 R; 需要 在 新 模型 
y= Bot BX t+ PXp Tt eisl 二 
(3.33) 
之 下 算出 如, B41,…,PB 的 最 小 二 乘 估 计 Bo ,PB*4,… ,BY .Bo 
仍 为 Y, 但 B81,…,B7 已 与 在 原 模型 (3.8) 之 下 求 出 的 B, ,1,…， 
Bs 的 最 小 二 乘 估计 记 ,1,，…, Bs 不 同 ,因此 涉及 较 多 计算 .下 面 的 
公式 则 只 须 用 到 原 模型 (3.8) 下 有 关 的 量 , 不 须 涉及 新 模型 
(3.33), 因 此 较为 简单 .为 引进 这 公式 ,把 (3.11) 式 定义 的 方 阵 上 
分 块 为 


1 = wm . 
Lal: L») 
其 中 工 | 1 为 7 阶 方 阵 , 记 方 阵 
D = (di;) = Lii— LoL Lal 
则 
R; — Ri = 2 da (3.34) 
2 


(3.34) 中 ,BB; 等 是 在 原 模型 (3.8) 之 下 已 求 得 的 . 
线性 回归 是 统计 学 应 用 中 碰 得 最 多 的 . 本 节 方 法 中 涉及 的 运 
算 ,早已 编 人 各 种 统计 软件 包 , 如 有 这 种 设备 , 则 只 须 输入 数据 即 
可 . 这 类 简化 公式 也 就 没有 多 大 实际 意义 了 . 
例 3.1 本 例 引 述 自 张 启 锐 著 《实用 回归 分 析 》p.60. 其 目的 
纯粹 是 为 了 显示 ,本 节 提 出 的 那些 抽象 公式 是 怎样 使 用 的 . 
本 例 共 有 三 个 自 变量 X,X,,X3, 因 变量 了 .对 这 些 变量 进行 
了 n=48 次 观测 ,原始 数据 (Xi;,X2;,X3i, Yi) = ,48, 没 有 
写 出 ,但 与 本 节 公 式 的 应 用 有 关 的 量 的 计算 结果 为 
Xi = 18.98, X, = 2.55,X; = 3.125,Y = 3.843 
(2052.98 49.15 782.12) 
L=| 49.15 12.46 13.50|1, > (Y, -了 TY) = 74.15 
| 782.12 13.50 577.25) 一 
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48 48 
NX ~ XI)Y, = 257.59, > (Xs < X)Y, =— 11.72, 


’ 2 | 1 一 ] 


-0 
SS (Xs; — XY, = 一 141.37 


i:—l] 
1 . 常数 项 B 的 最 小 二 乘 估计 为 了 =3.843 ,而 回归 系数 BI， 
PB3 的 最 小 二 乘 估计 则 是 下 述 方程 组 的 解 : 
2052 .98aj+ 49.,.15a; + 782.12uw = - 257.59 
49.15a1+ 12.46a; + 13.50a; =— 11.72 
782.12a1+ 13.50a; + 577.25¢; = — 141.37 


解 a1,a2,a3, 即 Bi ,PB;,B; 的 最 小 二 乘 估 计 B1, PB;,B3, 结 果 为 BI 


= 一 0.0488,B;= 一 0.5688,B3== -0.1655. 而 经 验 回归 方程 为 
y =3.843 -0.0488(zri - 18.98) - 0.5688(x, -~ 2.55) 
- 0.1655(x; — 3.125) 
=6.737 -0.0488ri — 0.5688x» - 0.1655x3 (3.35) 
为 计算 B,,…,B; 的 方差 协 方差 ,要 算出 了 工 的 逆 方 阵 C= 上 -1, 结 
果 为 


1.0931 - 2.7775 — 1.4160 
C=L!= 103 -2.7775 89.4009 1. 6725 
— 1.4160 1.6725 3.6119 

(3.36) 


于 是 得 到 

Var(B0)= 0o2/48=0.02080?,Cov(Bo,pB)=0,)=1,2,3 
Var(B1)=10 3x1.09310?, Var(B,)=10- 3x89.40090? 
Var(B;)=10 3x3.61190’ 

Cov(BI,B;) = 10 3x (2.,7775) 0 
Cov(B1,B;)=10-3x(—1.4160)0? 
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Cov(B,,B3)=10 3 x3.61190° 
2. 残 差 平方 和 按 公式 (3.17) 计 算 , 结 朱 为 
48 


>, 6 =74.15— (~ 0.0488)(— 257.59) 


i—l 
—(—0.5688)(— 11.72) 
—(—0.1655)(— 141.37) 
=31.5165 
自由 度 为 n 一 p 一 1 二 48 一 3 一 1=44, 而 得 到 误差 方差 o7 的 无 俩 
估计 52 为 :57=31.5216/44 一 0.7163. 
3. 各 回归 系数 的 区 间 估 计 , 取 置信 系数 1-w=0.95, 查 上 分 


布 表 ,t341(0.025) =2.02108. 于 是 按 (3.20) ,6; 的 区 间 估 计 有 8B; 土 
V0.7163X Vc X2.02108 的 形式 .以 (3.36) 中 的 cj 具体 值 代入 ， 
算出 结果 为 : 
B1: -0.0488 + 0.0564;p;: — 0.5688 + 0.5100; 
B;: —0.1655 + 0.1026 (3.37) 
4. 回归 函数 
m(x)= Bo + BI1(xi 一 18.98) 十 B2 (za — 2.55)+ B3( x3 和 
3.125) 的 区 间 估 计 , 按 公式 (3.22), 应 为 扬 (x)+vV0.7164 Xx 
A(x)x2.02108. 其 中 雇 (x) 即 为 方程 (3.35) 的 右边 的 表达 式 , 市 
)2(z) =1/48 + 11.0931(x1 — 18.98)* + 89.4009(x, — 2.55) 
+3.6119(z3 — 3.125)° 
-2x2.7775(zj -18.98)(z， - 2.55) 
— 2 x 1.416(x1 — 18.98)(x; — 3.125) 
+ 2x1.6725(x; — 2.55)(x;3 — 3.125)) x 103 
例如 ,对 点 x = (18,2.7,3) ,上 式 计 算 结果 为 
A:(x) = 0.02443,(r) = 3.8263 
而 得 到 其 置信 系数 0.95 的 区 间 估 计 为 
318 。 


3.8263 + v0.7164 x v0.02443 x 2.02108 
= 3.8163 + 0.2674 
在 zz 点 处 Y 的 预测 值 vo 的 0.95 置信 区 间 为 记 (z) 土 v0.7164 
(1+A-(z))!“Xx2.02108. 在 点 x = (18,2.7,3) 处 ,结果 为 
3.8263 + V0.7164 x v1.02443 x 2.02108 
= 3.8263 + 1.7314 

看 出 预测 的 精度 比 回归 函数 估计 的 精度 差 得 多 . 

5. 假设 检验 

一 个 回归 系数 为 0 的 检验 结果 (取水 平 a =0.05), 从 各 回归 
系数 的 区 间 估 计 即 得 出 :凡是 B 的 置信 区 间 包 含 0 者 , 原 假设 B 
=0 就 被 接受 ,不 然 就 被 否定 .因此 ,从 (3.37) 看 出 ,8; =0 被 接受 ， 
而 p=0 及 =0 都 被 否定 . 

Bi 三 0 虽然 被 接受 ,但 这 并 不 等 于 说 一 定 可 以 把 自 变量 Xi 去 
掉 . 这 个 问题 还 要 根据 具体 情况 全 面 地 去 考虑 ,不 能 单 任 这 个 检验 
就 作出 决定 . 

其 次 看 原 假设 Ho: B10,8,=0. 用 检验 (3.32), 要 按 (3.34) 
式 算出 R; 一 Ri1. 有 
2052.98 01) | _- [i 

49.15 12.46/°  \ 13.50 
L21 = (782.12,13.50),L>», = ($77.25) 


J 


于 是 


2052.98 49.15 
D=L1- LoL La = 


49.12 12.46 


782.12\/ 1 
-| 3 50] (577 苔 )(782.12,13.50) 
_ 2052.9% 9.15) ?059 .7 ed 
49.15 12.46 18.29 0.32 
1993.18 30.86 
-| 30.86 314 
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二 是 , 据 8 = -0.0488,Bs= -0.5688, 用 (3.34) ,得 
R;— R: =993.18(0.0488) + 12.14(0.5688): 
+ 2(30.86)(0.0488)(0.5688) = 8.006 


二 2,5- 一 0.7164. 故 


(Rs 一 Ri) = 7 x 8.006/ 0.7164 = 5.588 
查 斑 分 布 表 ,知已 ia)= 天 0.03)s3.21. 故 五 0 被 否 
定 . 

最 后 考虑 检验 问题 Ho: Bp 一 B» 一 3 一 0. 用 检验 (3.30), 其 检 
验 统 计量 之 分 了 为 


(~ 0.0488)(- 257.59) + (~ 0.5688)(- 11.72) 


~ (—0.1655)(— 141.347)) = 14.211 
故 (3.30) 中 的 检验 统计 量 之 值 为 14.211/0.7164= 19.837. 
因为 PF,,, p_i1(a) 一 F3 0.03)s2.82 , 故 Ho 被 否定 . 


6.3.5 应 用 上 值得 注意 的 几 个 问题 


在 一 匹 回归 应 用 上 所 曾 提 出 过 的 那些 值得 注意 之 点 ,在 此 仍 
然 有 效 . 多 元 回归 情 次 更 加 复杂 ,在 其 结果 的 解释 上 更 应 慎重 . 


1. 设 Y 对 自 变 量 Xi 的 回归 系数 估计 值 为 B) ,通常 把 它 解释 


为 : 当 X 增 减 1 单位 时 ,平均 说 来 因 变 量 Y 增 减 B; 单位 ,如果 X 
的 取 值 能 由 人 控制 ,其 范围 在 建立 经 验 回归 方程 时 所 用 数据 的 范 
二 内 , 且 在 尔后 的 使 用 时 ,其 条 件 与 建立 回归 方程 时 的 条 件 相 当 ， 
则 这 个 解释 可 以 认为 是 合理 的 . 

如 果 X; 本 身 也 是 随机 的 , 则 情况 复杂 ,不 仅 在 一 元 情况 下 所 
讲 的 那些 问题 此 处 都 存在 ,而 生还 有 一 个 各 和 白 变 量 之 间 的 相关 问 
题 .如果 蝇 变量 为 随机 的 ,它们 一 般 不 见得 独立 , 即 一 个 变量 ,例如 
X ,其 值 的 变动 往往 会 带动 其 他 变量 的 值 作 变动 .这 时 ,各 回归 系 
数 的 值 ,都 是 在 全 体 自 变量 值 的 联合 变动 的 格局 内 起 作用 ,孤立 地 
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抽 - :个 去 考察 就 不 一 定 很 现实 了 .在 这 种 情况 下 ,尤其 不 能 人 为 地 

去 设法 变动 其 中 一 个 (例如 和 ) 之 值 而 强行 压 作 其 他 自 变量 值 保 
寺 不 变 . 在 这 样 人 为 干预 下 所 作 的 预测 往往 与 实际 相去 其 远 . 

在 使 用 线性 回归 时 我 们 必须 牢记 一 个 基本 点 :真实 的 回归 也 
数 ,特别 在 较 大 的 范围 内 ,很 少 是 线性 的 .线性 是 一 种 近似 , 它 包 含 
了 一 种 从 实际 角度 看 往往 不 … 定 合理 的 假定 : 它 认 为 各 变量 的 作 
用 与 其 他 变量 取 什 么 值 无 关 , 日 各 变量 的 作用 可 以 登 加 .因为 ,和 
y=bot brit 二 Drp 则 不 论 你 把 zx，， ,Tp 之 值 固 定 在 何 
处 , 当 zi 增 减 1 单位 时 :y 总 是 增 减 2 单位 .事实 常 不 如 此 . 例 
如 ,以 Y 记 某 种 农作物 的 百 产量 ,X| ,XX; ,Xs 记 每 调 播种 量 ,施肥 
人 Xi 起 的 作用 如 何 , 与 X;, XX; 之 值 有 关 , 其 他 亦 

然 . 这 种 现象 称 为 各 因素 之 间 的 “交互 作用 ”. 如 果 专 业 知 识 或 经 验 
人 ,至 少 有 - -部 分 自 变 量 之 间 有 显 苦 的 交互 作用 存在 , 则 在 

变量 仁 较 大 的 范围 内 采用 线性 回归 就 不 会 有 很 好 的 效果 . 且 在 
让 种 情况 下 单个 轨 系数 意义 的 解释 也 于 其 他 变量 的 平 
均 而 冶 . 

2. 在 实际 应 用 中 ,一 个 回归 模型 内 可 包含 为 数 其 多 的 自 变 
量 , 其 中 难免 有 些 是 密切 相关 的 .例如 , 若 XI 和 X， 高 度 线性 相 
关 , 则 XX| 起 的 作用 ,基本 上 可 由 X, 挑 起 来 .反之 亦 然 . 这样, 如 果 
你 从 方程 中 删除 自 变 量 X1,X; 中 的 一 个 , 南 对 剩 下 的 p-1 个 自 
变量 再 配 出 方程 ,实际 效果 与 原来 的 相当 .这 就 造成 下 述 在 假设 检 
验 上 看 来 了 矛盾 的 现象 :“B1==0" 或 “PB,;=0” 都 可 以 被 接受 ,而 “BI = 
二 0 则 被 否定 . 

所 以 ,如 林 月 变量 是 随机 的 , 则 对 它们 之 间 的 相关 性 的 了 解 很 

这 .这 有 助 于 删 去 那些 不 需要 的 和 月 变量 ,使 配 出 的 回归 方程 有 更 
好 的 稳定 性 ,并 简化 对 回归 方程 的 解释 . 

3. 为 得 出 回归 系数 的 估计 值 ,要 解 线性 方程 组 (3.10), 如 果 
系数 方 阵 上 的 行列 式 | 虐 | =0, 则 方程 组 (3.10) 无 解 .在 应 用 上 可 
能 碰 到 这 样 的 情况 :| 工 | 不 为 0 但 很 接近 于 0. 这 时 , 诸 系 数 7 在 
计算 上 一 点 点 误差 也 可 能 导致 方程 组 (3.10) 的 解 的 重大 改变 , 因 
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而 匡 由 系数 的 估计 重 就 失 择 了 其 稳定 性 和 可 信和 性 . 

这 种 情况 在 统计 上 称 为 “ 复 共 线性 , 意 指 硅 干 个 日 变量 之 间 
他 在 在 剖 度 向 党 人 大 系 , 在 作 才 元 绕 侍 国 办 分 析 轩 , 复 太 线 性 古 一 
个 很 有 破坏 性 的 东西 . 几 是 可 能 ,应 极力 予以 避免 .如 果 各 自 变 
取 值 可 人 为 控制 , 自 可 通过 适当 的 设计 达到 这 一 点 .如 果 自 变量 是 
随机 的 . 遂 过 分 析 其 相关 性 并 删 去 阁 干 不 必要 的 (可 由 其 他 自 变 量 
代 蔡 的 ) 月 变量 ,可 能 达到 这 一 点 .如 这 些 都 不 成 , 则 不 宜 强 行使 用 
最 小 二 乘法 ,可 考虑 用 其 他 更 富 稳定 性 的 方法 取代 之 .这 个 问题 涉 
及 太 宽 ,不 能 在 此 细 述 .关于 复 共 线性 , 张 启 锐 的 《实用 回归 分 析 》 
党 六 但 可 以 参考 .关于 回归 系数 的 种 种 估计 方法 (最 小 二 乘法 以 外 
的 方法 ), 可 参看 陈 希 括 及 王 松 桂 的 《近代 回归 分 析 》 第 四 章 , 及 上 
引 张 局 锐 的 书 第 九 章 ， 


6.3.6 可 转化 为 线性 回归 的 模型 


有 时 ,回归 艺 数 并 非 自 变量 的 线性 函数 ,但 通过 和 
量 , 可 以 转化 为 线性 回归 去 处 理 ， 党 几 个 例子 说 明 这 一 
例 3.2 没有 个 自 变量 和 因 变 给 如 从 生生 天 这 才 
或 效 据 的 局 不 ,认为 回归 模型 有 指数 形式 
Y= bot+ be™ “+e 
其 中 凋 数 c 已 知 ,00,61 未 知 ,e 为 随机 误差 . 则 通过 取 新 自 恋 : 量 Z 
= ce 将 其 转化 为 一 元 线性 回归 
Y= bout+biZ+e (3.38 ) 
在 在 原 模型 下 对 (X ， 站 ) (X，Y ), 则 
有 了 观测 数据 (Zi ) , (和 ZZ, 站 ,), 其 中 ZZ,= 
ei,i 二 1,…,n. 若 c 也 未 知 ， 则 这 一 做 法 失效 
例 3.3 仍 设 有 一 个 自 变量 X 和 因 变 量 Y, 并 认为 回归 函数 
为 X 的 多 项 式 ， 
Y = POX bX tt bX re (3.39) 
进 个 新 日 变量 X1,…,X,y, 其 中 XX =X,j 一 1,…,p, 则 模型 
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(3.39) 转 化 为 有 p 个 自 变 量 X1,…,X, 的 多 元 线性 回归 

Y = b+ OXIt + OX,+e (3.40) 
苦 在 原 模 型 下 对 (X,Y) 有 了 观测 数据 (XI ,1),…, (X,Y,), 则 
等 于 在 新 模型 (3.40) 下 有 了 观测 数据 

(XU Xp, yi) 1 一 工 7 
其 中 X= 三 1 ,psi=1 71. 

(3.39) 称 为 多项式 回归 ”, 是 一 个 应 用 较 多 的 回归 模型 .经 过 
转化 后 的 回归 模型 (3.40) 成 为 多 元 的 .变换 以 后 的 自 变量 XI ,…'， 
X,， 之 间 有 严格 的 玛 数 关系 ,这 没有 关系 .因为 在 前 面 讨 论 线性 回 
归 时 ,并 没有 对 自 变 量 之 间 可 能 有 的 关系 作 过 任何 限制 . 

在 模型 (3.39) 之 下 ,假设 “b, ==0” 有 特殊 的 意义 ,比方 说 ,一 开 
始 我 们 较 有 把 握 认 为 取 2 阶 多 项 式 已 够 了 ,但 还 不 太 放 心 ,希望 检 
验 一 下 .于 是 我 们 取 模 型 (3.39) 而 令 p = 3. 篆 假设 “5b;=0” 通 过 
了 , 则 数据 不 与 我 们 原先 的 想法 (回归 取 为 2 阶 多 项 式 已 足 ) 了 矛盾 . 
否则 就 须 调整 原来 的 想法 . 

多 个 变 元 的 多 项 式 回 归 也 一 样 变换 .例如 ,包含 两 个 自 变 量 
X1,X; 的 二 次 多 项 式 回归 模型 

Y= bot OX +t bp Xs + bXT + bX3 + bs XIX,+e 
可 通过 采用 新 自 变 量 

Zi1= Xi = XZ3 = Xi1,Z = XI,Zs = XIX， 
化 为 多 元 线性 模型 
Y= bo0+oZ1+*+ bsZs+e 

在 有 些 情况 下 ,不 仪 自 变量 可 施行 变换 ,对 因 变 量 也 这 样 做 . 
例如 X,Y 有 回归 方程 y= boe”w* ,bo.6b1 未知 ,这 不 是 线性 的 ,也 
不 能 通过 自 变 量 的 变换 化 为 线性 的 .但 车 令 Z=logY, 则 2Z= 
logbo + b1X=Bot+ Bi1X(Bo 王 logb0,BI= 61), 而 化 为 线性 的 . 

不 过 对 因 变 量 所 作 的 变换 , 较 之 对 自 变 量 所 作 的 变换 ,存在 一 
个 理论 上 的 问题 . 即 自 变量 的 变换 不 改变 模型 中 的 随机 误差 e 这 
一 项 .因此 ,有 关 e 的 假设 (如 均值 为 0, 方差 非 0 有 限 ,或 e 服从 
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正 态 分 布 之 类 ) 全 都 保持 有 效 , 对 因 变 量 之 变换 则 不 然 . 拿 本 例 米 
说 , 原 模 型 为 
Y = be +e (3.41) 
把 了 换 成 Z=logY ,得 Z=log(boerY +e). 形 式 上 可 写 为 
Z=pb+pX+sEs= log(l tebole "4*) (3.42) 
e 已 不 能 满足 e 原 有 的 条 件 , 其 至 还 和 X 有 关 . 
因此 ,在 对 因 变 量 作 变 换 时 ,我 们 不 是 拘泥 于 从 (3.41) 到 
《3.42) 这 种 形式 运算 .而 是 从 头 开 始 :我 们 党 得 并 认定 , 若 取 之 = 
logY 为 因 变 量 , 则 X,2 的 回归 很 近似 线性 ,不 妨 就 认为 它 有 
(3.42) 的 形式 而 e 满足 以 往 对 e 施加 的 条 件 .这 有 其 道理 可 讲 : 因 
为 反正 原 模 型 (3.41) 中 e 的 性 质 ,也 无 非 是 一 种 假定 而 已 ,并非 先 
天 绝对 无 误 . 转 化 成 (3.42) 后 ,我们 未 党 不 可 对 e 作出 类 似 的 假 
定 , 并 无 先天 的 理由 认为 :对 的 假定 一 定 不 如 对 e 的 假定 那样 符 
合 事 实 . 
更 进一步 ,为 达到 线性 回归 ,有 时 对 自 变 量 和 因 变 量 都 要 施加 
变换 ,其 方法 和 道理 与 上 同 .例如 , 若 回归 方程 为 y= boe 们 , 则 通 
过 变换 u = 1/r ,v= logy ,转化 为 线性 型 v= logbo + Bla. 


6.4 相关 分 析 


在 相关 分 析 中 ,所 涉及 的 变量 都 是 随机 的 , 且 处 于 平等 的 地 
位 , 故 用 Xi ,…,X 来 记 , 而 不 用 Y. 


6.4.1 相关 系数 的 估计 和 检验 


设 (XX ,XX;) 服 从 二 维 正 态 分 布 N(a ,0 ,01,07,0), 其 概率 密 

度 限 数 见 第 二 章 (2.7) 式 .在 第 三 章 指出 :a ,of 分 别 是 Xi 的 均值 

方差 ,6 ,oz 分 别 是 X, 的 均值 方差 ,而 o 是 Xi,X， 之 间 的 相关 系 

数 .在 3.3 节 中 仔细 论述 了 相关 系数 的 意义 ,尤其 是 指出 了 ; 当 总 

体 分 布 为 正 态 时 ,相关 系数 确实 是 变量 之 间 的 相关 性 的 合理 指标 ， 
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而 在 非 正 态 人 情况 则 只 是 线性 相关 程度 的 上 度量 
相关 系数 o 的 公式 十 
0 = Cov(X1， Xs)/(Var( XI)Var(X,))!” (4.1) 
这 个 公式 局 发 Jp 的 一 个 估计 方法 , 即 窍 估计 法 . 设 (XlI1, X21)， 
,XIX ) 为 (Xi1,X;y) 的 个 独立 同 分 布 的 观察 值 , 按 和 矩 法 ， 


分 别 以 (X; 一 > Ni/ ,J 一 1,2) 
D(X )27(7 1), > (X， -XX,)? /nn 一 1) 和 和 
i=1 


3 (Xi ~ XI)(X,, — X;)/(n -1) 


去 估计 Var(X,), Var(X2> ) 利 Cov(X|,X,). 由 此 ， 按 (4. 1 ) ， 得 出 o 
的 估计 为 


2 (X1; — Xi) (Xs; — X,) 
rr 一 (4.2) 


> (Xi1;—X, 六 > > (xs — X,)? 1 
r 称 为 ' 样本 相关 系数 "， 
对 o 的 检验 ,最 有 兴趣 的 是 原 假 设 
Ho:po=0 (4.3) 
对 立 假设 为 p 了 0. Ho 表示 Xi, X; 独立 (在 第 三 章 已 指出 这 在 非 
正 态 情 况 下 不 成 立 ) .一 个 显然 的 检验 方法 是 :计算 ~， 
当 | 7 | 过 C 时 接受 万, ,不 然 就 和 否定 Ho (4.4) 


常数 C 与 样本 大 小 及 检验 水 平 a 有 关 . 要 决定 C, 必 须 求 出 在 
o=0 时 样本 相关 系数 > 的 分 布 . 这 分 布 不 很 复杂 ,但 我 们 这 里 无 
法 介绍 推导 过 程 了 ,只 指出 : 当 p=0 时 有 

Va 2r/VI 二 天 — /7 (4.5) 
由 于 | -| 过 C 等 价 于 | =2r/vT | 入 2CAVT 斌 ， 


* 证 明 见 习题 8. 


出 (4.5) 不 难 定 出 : 当 给 定 检验 水 平 < 时 ,(4.4) 中 的 C 应 取 为 方 
程 /77 -2C/VT-C3=t 2(a/2) 之 解 , 妈 

C= a/2)/Vn -2+ 1 (a/2) (4.6) 
对 1 二 20,30,…,100, 由 (4.6) 算 出 的 C, 为 (a 二 0.05) 


nn 20 30 +40 30 6 70 380 90 100 


人 0.441 0.360 0.328 0.290 0.254 0.2334 0.220 0.207 0.197 


当 样 本 大 小 7 为 20 时 ,即使 样本 相关 系数 达到 土 0.4, 疝 个 是 
以 推断 p 异 于 0. 随 着 n 增加 ,这 个 界限 逐步 下 降 , 但 即使 ”达到 
100 ,这 个 界限 也 还 大 约 在 0.2. 这 说 明 : 要 发 现 两 变量 之 间 较 微弱 
的 相关 ,样本 大 小 守 必须 很 大 才 行 .同时 也 说 明了 :对 较 小 的 mr 
的 精度 很 差 ,意义 不 大 . 

当 o 兴 0 时 样本 相关 系数 x 的 分 布 问题 ,在 本 世纪 初 曾 是 KK. 
皮尔 了 进 和 有 . A. 费 软 尔 等 统计 学 大 师 春 力 人 研究 的 对 象 , 最 后 被 费 
欣 尔 在 1915 年 解决 了 ,其 形式 极为 复杂 ,在 此 不 能 细 述 了 . 


6.4.2 偏 相 关 


在 统计 学 上 ,相关 系数 作为 随机 变量 之 间 相 关 程 度 的 刻画 ,用 
得 很 多 ,但 在 其 解释 上 则 应 注意 几 点 :一 是 统计 相关 不 能 等 同 于 因 
有 果 关 系 , 这 一 点 我 们 在 第 三 章 中 已 指出 过 了 了 .例如 ,分 别 以 XIU,X， 
记 一 个 人 的 饮食 和 衣 寿 消费 , 则 Xi,xX: 有 较 强 的 相关 .但 很 难说 
这 一 者 有 何 因 有 果 天 系 : 说 好 吃 的 人 多 半 好 穿 , 或 者 好 穿 的 人 多 半 好 
吃 ,未 见得 可 信 . 但 既然 如 此 ,为 什么 在 观察 结果 上 又 会 显示 出 较 
强 的 相关 呢 ? 这 就 涉及 到 为 一 个 需要 注意 之 点 :所 考虑 的 变量 (如 
此 处 的 X1,X,) 并 非 孤 立 的 ,它们 除 彼此 可 能 有 的 影响 外 ,还 受到 
一 大 批 其 他 变量 (不 妨 暂 称 为 XX;,…,X, 等 ) 的 影响 .由 于 这 个 原 
因 , 机 天 系数 有 时 被 称 为 “完全 相关 系数 ” .意思 是 说 ,在 其 中 总 结 
了 由 -- 切 影响 带 来 的 相关 性 .这 个 说 法 解 妓 了 上 上面 提出 的 那个 问 
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题 :为 何 看 来 彼此 并 无 密切 因果 关系 的 变量 ,在 观察 结果 上 会 显示 
出 较 强 的 相关 . 这 原因 就 在 于 被 其 他 因素 带动 起 来 了 . 拿 上 例 来 
说 ,如 以 Xi 记 大 的 收入 , 则 一 般 说 来 ,收入 大 的 人 各 方面 消费 都 
倾向 于 高 , 它 带动 了 X1( 吃 ) 和 Xs,( 穿 ) 增 长 ,以 致使 二 者 显示 出 较 
强 的 下 相关. 可 以 设想 ,如 果 能 用 某 种 方式 把 义 ; 的 影响 消去 , 则 
X1,X; 可 能 显示 很 不 一 样 的 相关 性 质 . 例 如 它 可 以 转 为 负 相 关 ， 
因为 在 一 定 收 入 的 人 中 ,在 吃 、 穿 中 的 一 个 方面 消费 大 的 人 ,一 般 
会 导致 为 一 方面 消费 的 减少 . 

一 般 , 设 有 Pp 个 随机 变量 XX ,X;,X3,… ,Xs. 把 义 3,X4,…， 
Xp 的 影响 从 Xi,X; 中 消去 ,剩余 的 部 分 分 别 记 为 X 和 义 。. 则 
义 ! ,Xz 的 相关 系数 称 为 Xi,X: 对 (XX;… ,XX, ) 的 偏 相 关系 数 ,并 
记 为 p12.634…9) 在 以 上 论述 中 ， 消 去 "一 词 的 含义 并 未 严格 界定 ， 
但 一 般 是 在 最 小 二 乘法 的 意义 下 .例如 ,从 Xi 中 消去 X3，…,X。 
的 影响 , 指 的 是 找 一 个 线性 式 

Li(X;,",X,) = cot+ caX3+ "+ cpX, 
使 [Xi 一 上 1(X;,…, 义 ,)1 达到 最 小 ,剩余 就 是 
X1= Xi— Li(X;,,…, X,) 
同 理 找 线性 式 L( Xs,… Xp) 二 do +d3X; 二 … 十 dpX,, 使 ELX, 一 
La(X3,… ,处 ,) 上 最 小 ,和 镜 余 是 
X= X»— Lo(X3,, X,) 

Xi ,Xs 对 (XX,…, 义 ,) 的 偏 相 关系 数 pp. 就 是 X1,X5 的 相 
关系 数 .要 算出 其 表达 式 ,就 需要 算出 上 文 的 线性 式 上 | 和 工 ,. 下 
面 我 们 对 p =3 这 个 简单 情况 来 计算 一 下 .分 别 以 Cl1y ac330T， 
oj,oj 记 Xi,X: 和 Xi 的 均值 和 方差 ,以 012;P13;0233 分 别 记 Xi， 
XX 之 间 ,X1,X; 之 间 , 和 XX;,X; 之 间 的 相关 系数 . 

关于 找 一 个 线性 式 L1(X;) 使 E(X| 一 L1(X3))? 达到 最 小 的 
问题 ,已 在 3.3 节 中 讨论 过 了 , 按 该 章 的 (3.$) 式 ,用 此 处 的 记号 ， 
有 


Li(X3) = al + 0o103'03(X;3 ~ a3) 


同 理 有 
Ls(X3) = aa + 06203 p23( X3.— 43) 
故 有 
Xi = Xi — ail—.0103 p13(X3 — a3) 
X’ = X 一 aa 一 aa p23(X3— a3) 
显然 ,E(X1) = E《X5)==0, 而 按 第 三 章 (3.6) 式 ,用 此 处 的 记号 ， 
有 
Var(X1) = of(1 — p13), Var(X>) = o3(1 ~ pos) (4.7) 
.而 
Cov(X1,X) = E(X1,X) = E[(X1 — al)(X» ~ a7))] 
— o103 0BE[(X3 ~ a3)(X» — a2)] 
— go203 p23El(X; ~ a1)(X;, — a3)] 
+ o103 P130203 0023 五 [(X3 一 43) 二 
= 0102P12 — 0103 P130203023 
— 0203 P230103013 十 G10203 O1302303 
= 0102012 一 0l02013023 = 0102(012 一 P13023) (4.8) 
由 (4.7),(4.8), 得 : 
O12:(3) = Corr(X1,X2) 
| =Cov(X1, XX)/(Var(X1)Var( X»))!'” 
=(p12 - p13023)/(1 - pt3)(1 — p13) (4.9) 
细 察 表达 式 (4.9), 有 如 下 的 构造 :把 Xi, Xs, X; 之 间 的 相关 系 
数 , 连 同 X; 与 X; 之 间 的 相关 系数 oi;=1 也 在 内 ,排列 成 一 个 三 阶 
方 阵 ( 称 为 Xi,X2,X3 的 “相关 阵 ”) 
p11 P12 P13 1 p12 013 
P= |p p22 03| = Ip12 1 p23 
. P31 P32 0b33 p13 023 1 
此 处 用 了 pi;==1,w; 二 0;: 则 其 (1,1) 元 的 子 式 , 即 划 掉 P 的 第 一 
行 第 一 列 所 剩 下 的 行列 式 , 等 于 Pl1=1 p53. 同 样 ,(2,2) 元 的 子 
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式 为 P =1-pof3,(1;2) 元 的 子 式 为 Pi 二 p12 一 P13623: 因此 
012:03) = 了 27V PnP 

这 个 表达 式 , 可 以 证 明 ， 能 推广 到 p 个 自 变量 XXX ) Xs 的 情 

况 . 仍 以 p; 记 X;,X; 之 间 的 相关 系数 (oz = 1,pi 二 pi),P 记 其 相 

关 阵 : : 


人 0127 ob 
p= (410) 
pa Pp2 入 Ppp , 


而 以 Pj, 记 PP 的 (x ， ?) 克 的 隆起 ， 即 从 已 中 划 去 第 zx 行 第 v 列 所 
成 的 行列 式 , 则 
O12:G34p) = Pw/ vy PuiiP2; (4.11) 

从 表达 式 (4.9) 看 出 一 个 现象 . 设 ob >>0, 但 不 太 接 近 于 1. 即 Xi， 
X:， 为 正 相 关 ,但 相关 程度 不 是 非常 密切 .又 of ,023 都 很 接近 1 , 则 
(4.9) 式 之 分 子 将 小 于 0, 即 ov2.03) 之 0. 就 是 说 ,尽管 Xi,X， 的 通 
常 相关 系数 为 正 , 其 偏 相 关系 数 可 以 为 负 . 这 拿 前 面 举 的 那个 Xi 
= 上 电 的 支出 ,X2= 穿 的 文 出 ,X3 三 收入 的 例子 可 作 一 个 印证 .Xi， 
X; 的 (完全 ) 相 关 p12z 大 于 0, 但 ol,o23 看 来 都 为 正 且 很 大 , 故 
op.0G3) 当 小 于 0: 从 吃 穿 支出 中 消去 收入 的 影响 ,等 于 在 固定 收入 
的 情况 下 考虑 二 者 的 关系 ,其 相关 为 负 就 不 难 理解 了 . 当然 , 反 过 
来 也 可 能 : 即 p13<0 但 o12.03)>0. 

因此 ,在 涉及 多 个 变量 相互 影响 的 问题 中 ,不仅 考虑 完全 相关 
系数 ， 和 周记 各 种 有 意义 的 入 相 关系 数 ( 在 全 部 p 个 目 变 量 中 ， 
可 任 选 出 太 之 3 个 : 和， ;i , 而 考虑 NX; ， 久 ; ,对 (Xi ) 及， /的 
但 相关 系数 . 其 计算 仍 按 (4 11)， 只 是 在 Pp 中 要 把 不 是 站 有 
那些 行列 都 划 去 ) ,这 样 对 整个 相关 的 图 景 就 可 获得 深入 一 层 的 了 
解 . 

读者 也 不 要 误 以 为 偏 相 关系 数 高 于 完全 相关 系数 ,这 二 者 各 
说 明 “ 相 关 ” 这 个 概念 的 一 个 侧面 ,其 会 义 不 同 .在 什么 情况 下 哪 一 
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种 相关 更 为 贴切 ,要 看 问题 的 性 质 . 
如 果 对 (XX ,… ,XX, ) 进 行 了 次 观察 ,得 样本 
(Xi Xp) ,i = 11, 
则 可 以 用 前 面 的 方法 ( 见 (4.2) 云 ) 舍 计 X, 与 X, 的 相关 系数 , 即 
计算 样本 相关 系数 ru. 


一 -> (Xi 一 XX i xX. [> (Xi Xu 


PD, 一 又 | 12 


其 中 XX 1 + Xi AR=1, ,六 有 La = 1 ,r,,= Toe 
”代替 已 中 的 得 样本 相关 隆 


rll 六 12 rip 
y .。. ， 
R=| 2 7 的 (4.12) 
pl ?Tp2 ?pp 
然后 用 
rT12.(34-…p) 一 R/V Ri R>; (4.13) 


去 估计 rj2.(34.…p). 它 称 为 样本 偏 相 关系 数 . 
如 条 要 检验 有 关 py2.(34…5) 的 假设 , 则 必须 假定 变量 服从 正 态 
分 布 .在 这 种 假定 下 ,可 以 证 明 : 原 假设 
Hy:pw.c34..s) = 0 (4.14) 
的 一 个 水 平 a 的 检验 为 
| rosep) St pla/2) /nn -p+ 2_p(a/v2)]12 ,接受 扎 
rsp > tp(a/2) /An - p+.(a/2)]12, 否 定 Ho 
(4.15) 
此 检验 与 前 述 相关 系数 为 0 的 检验 之 差别 仅 在 于 ,把 (4.6) 式 中 的 
7 一 2 换 为 na 一 p 
例 4.1 随机 抽取 1000 人 调查 其 (每 年 ) 吃 的 支出 ( 久 ,), 衣 
着 文 出 (X;) 和 和 收入 (X;), 算 出 的 样本 相关 系数 分 别 为 rj, = 0.57， 
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ri=0.82,r3=0.80. 对 7=1000,a=0.05, 忆 -20(a2) 和 加 -3 
(ae/ 2) 都 可 取 为 1.96. 于 是 易 算得 |rw|>1,2(a/ 2)/ 
Vn 一 2+ 坊 _，(g/2), 因 而 X1,X; 的 (完全 ) 相 关 在 a =0.05 的 
水 平 上 为 显著 的 且 为 正 相 关 . 按 公式 (4.9), 算 出 

r12.(3) = (ri12 一 riara3)/V (1 -rh)(1 — x33) =— 0.73 
它 在 水 平 a =0.05 时 为 高 度 的 负 相 关 . 


6.4.3 复 相 关 


设 有 若 于 个 随机 变量 X|,…, X,. 可 能 有 这 种 情况 :X1 对 每 
个 X(j 宇 2) 的 相关 性 不 一 定 很 显著 ,但 全 体 X,,…,X, 合 起 来 ， 
则 与 Xi 有 和 较 显 著 的 相关 .例如 , 设 Xi 为 某 种 水 田 农作物 的 产量 ， 
X，,… ,XX 为 该 作物 生长 期 那 几 个 月 的 各 月 降雨 量 ( 例 如 3、4、5 .6 
月 ), 盏 产 与 指定 一 月 的 降雨 量 肯 定 有 关 , 但 不 一 定 十 分 大 ,而 全 体 
这 几 个 月 的 降雨 情况 , 则 肯定 与 雷 产 有 更 大 的 相关 .这 种 以 XI 为 
一 方 ,XX,,…, Xj 全 体 为 一 方 之 间 的 相关 , 称 为 XI 与 (X,,…,X,) 
的 “ 复 相 关 . 

这 种 复 相关 的 定义 ,与 偏 相关 有 其 相似 之 处 ,就 是 也 要 找 X。，， 
… ,Xs 的 一 个 线性 式 上 (Xs,… ,Xp) = co+cX+…+cxX， 使 
ELX1 一 L(X2,…,X,)] 了 达到 最 小 .然后 ,Xi 与 L(X,,…,X,) 的 
通常 相关 系数 ,就 定义 为 XU 和 (XX,,…, XX,) 之 间 的 “ 复 相关 系 
数 ”, 并 记 为 P1(23-…p): 

求 L(X2,…,X,) 的 方法 ,与 3.3 节 所 用 方法 相似 (那里 解决 
了 p=2 的 情况 ). 仔细 推 导 过 程 不 在 此 写 出 了 ,我 们 只 给 出 最 后 
的 结 来 为 


oil =V 1 1PI/Pn (4.16) 
这 里 1P| 为 (4.10) 所 定义 的 方 阵 P 的 行列 式 , Pl 如 前 ,是 方 阵 PP 
的 (1,1) 元 的 子 式 . 
如 宁 对 (Xi1,X2，…,X) 进 行 了 ?2 次 观察 ,得 样本 (Xii,X2;， 
Xpi) =1 ,xn, 则 由 之 计算 出 样本 相关 阵 RG( 见 (4.12) 式 ), 以 
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R 取代 (4.16) 中 之 己 , 得 样本 复 相 关系 数 
rio3.p) = VT- |RI/RI (4.17) 
它 可 作为 p1023…p) 的 估计 . 
关于 复 相 关系 数 的 检验 ,实用 上 有 兴趣 的 是 
Ho: p123.…p) = 0 (4.18) 
直观 上 看 ,一 个 显然 的 检验 方法 是 
当 ri03..5) 去 C 时 接受 Ho ,不 然 就 否定 Ho。 (4.19) 
要 依据 检验 水 平 a 去 决定 (4.19) 中 的 常数 C ,就 必须 求 出 当 Ho 
成 立时 ,ric3… 的 分 布 . 可 以 证 明 ; 当 正 态 假定 成 立 且 Ho 为 真 
时 ,rc3..5) 的 分 布 为 所 谓 “8 分 布 ”, 其 密度 函数 fA) 为 
1 
f(r) = p23 ,2 3 


2 好 (1 7 二 0<x<1 


U， 其 他 全 
(4.20) 
其 中 B[ 了 7 一 ,3 了 ) 曾 在 第 二 章 的 附录 中 定义 过 .用 这 个 分 布 去 
决定 (4.19) 中 的 C, 可 以 通过 下 分 布 表 .因为 ,在 (4.20) 的 基础 上 
可 以 证 明 : 在 Ho 成 立时 有 


， 
np 7123..p) 、 

2 ~ Fp- - 4.21 
p—1 1 rs.,, (p-1)/2,(n-p) /2 ( ) 


Fj, 为 自由 度 a ,6 的 分布 ( 见 第 2 章 例 4.11). 由 (4.21), 定 出 
在 给 定 水 平 a 时 ,(4.19) 式 中 的 C 为 
人 一 


[全 Fo- D2,(n- pla 中/ To va palo))] 
. (4 .22) 
在 以 上 的 叙述 中 ,Xi,…,X。 也 可 以 只 是 考察 的 全 部 变量 中 
的 一 部 分 . 例如, Xi 代表 亩 产量 ,X,,…,X, 代表 所 考察 的 全 部 气 
象 因子 ,如 有 关 各 月 的 降水 量 ,月 平均 气温 等 ,而 X, ,1,…,X, 等 
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则 代表 与 田间 管理 有 关 的 因子 ,另外 还 可 以 有 别 的 因子 .我 们 可 以 
考虑 Xi 与 (X,,…,X,) 的 复 相关 ,以 看 看 调 产 量 与 气象 因子 相关 
的 程度 如 何 ,可 以 考虑 Xi 与 (X, ,1,…,X,) 的 复 相关 ,以 看 看 亩 
产量 与 管理 因子 相关 的 程度 如 何 , 等 等 .上 面 所 说 的 估计 和 检验 方 
法 当然 仍然 适用 . 


6.5 方差 分 析 


方差 分 析 是 我 们 多 次 提 到 过 的 英国 大 统计 学 家 费 软 尔 在 本 世 
纪 20 年 代 创立 的 . 那 时 他 在 英国 一 个 农业 试验 站 工作 ,需要 进行 
许多 田间 试验 ,为 分 析 这 种 试验 的 结果 . 他 发 明了 方差 分 析 法 . 尔 
后 这 个 方法 被 用 于 其 他 的 领域 ,尤其 是 工业 试验 数据 的 分 析 中 , 取 
得 了 很 大 的 成 功 . 

这 里 已 经 点 明 :方差 分 析 所 针对 的 数据 ,是 经 过 一 定 的 “设计 ” 
的 试验 的 数据 ,并 非 任何 杂乱 无 章 的 数据 都 适 于 使 用 方差 分 析 法 
的 .说 清楚 一 些 ,为 了 能 有 效 地 使 用 方差 分 析 法 ,试验 在 安排 上 必 
须 满足 一 定 的 要 求 . 在 数理 统计 学 中 有 一 个 专门 分 支 , 叫 “ 试 验 的 
设计 与 分 析 ”, 就 是 专 为 讨论 这 个 问题 .其 中 的 “分 析 ”, 主 要 是 指 方 
差分 析 , 但 也 不 限于 此 . 

本 书 以 其 性 质 所 限 ,不 可 能 深入 地 从 理论 上 阐述 这 些 问题 ,或 
涉及 过 多 细节 . 这 一 节 的 目的 ,只 在 于 结合 几 种 最 简单 的 情况 , 介 
绍 一 下 方差 分 析 的 基本 思想 和 做 法 ,也 顺便 解释 一 下 试验 设计 的 
某 些 重要 概念 . 


6.5.1 单 因 素 完全 随机 化 设计 
假定 某 个 农业 地 区 原来 不 曾 种 植 小 麦 , 现 在 打算 种 植 这 种 作 
物 .各 地 已 有 过 一 些 优良 品种 ,但 因 本 地 区 并 无 种 植 小 麦 的 经 验 ， 
不 知道 哪 一 个 品种 最 适合 本 地 区 (有 最 高 的 产量 ), 甚 至 也 不 知道 
这 些 品种 对 本 地 区 是 否 有 差别 . 为 此 进行 一 个 田间 试验 . 取 一 大 块 
地 将 其 分 成 形状 大 小 都 相同 的 小 块 . 设 供 选择 的 品种 有 上 天 个 . 
:333 ， 


我 们 打算 其 中 的 ma 小 块 种 植 品种 1 ,m3 小 块 种 植 品种 2, 等 等 ， 
71 十 2 十 三 0.21 7 7 的 选取 并 无 严格 限制 .例如 ,让 
1 三 75 二 三 4.( 如 nA/k 为 整数 ), 就 是 一 种 第 用 的 选择 . 当然 ， 
也 可 能 有 某 种 原因 使 得 夯 外 的 选择 更 好 .这 没有 关系 ,不 妨碍 试验 
数据 的 分 析 . 

分 配 数目 定 了 ,接着 就 要 定 出 哪些 小 块 分 给 哪些 品种 .而 这 是 
用 随机 化 的 方法 来 定 ,做 法 如 下 : 取 nn 张 纸 片 ,上 面 分 别 写 上 数字 
1.2,…,2 .把 它 混 乱 并 放 人 一 个 盒子 里 ,然后 一 张 一 张 地 依次 抽 
出 来 .最 先 抽出 的 zi 个 号 码 给 品种 1, 其 次 抽出 的 z; 个 号 码 给 品 
种 2, 以 此 类 推 一 一 当然 ,事先 已 把 上 述 ”小 块 地 从 工 到 标 了 
号 .例如 ,nl=3. 硅 最 先 抽出 的 3 张 纸 条 上 面 的 数字 依次 是 10， 
12,3, 则 品种 1 种 植 在 标号 为 3,10 和 12 这 3 小 块 地 上 . 

以 上 纹 是 这 个 简单 的 品种 试验 的 设计 过 程 .不 要 看 它 简 单 , 它 
却 包含 了 由 费 吹 尔 指 出 的 “试验 设计 三 原则 ”中 的 两 条 ( 另 一 条 将 
在 6.5.4 小节 中 解释 ): 

1. 重复 . 即 上 述 下 1， 好 2 1, 都 大 于 1: 每 个 品种 不 是 只 种 
植 在 一 个 小 块 ,而 是 多 个 小 块 , 即 有 重复 . 这样 做 的 原因 就 是 因为 
有 随机 误差 存在 ,而 只 有 通过 重复 才能 对 这 种 误差 的 影响 作出 估 
计 . 在 本 例 中 ,随机 误差 的 来 源 , 有 各 小 块 地 在 条 件 上 的 差别 ,有 在 
进行 田间 操作 和 管理 上 的 不 均匀 性 (如 施肥 时 各 小 块 受 肥 总 会 略 
有 差别 ), 及 其 他 可 以 设想 和 未 曾 注意 到 的 种 种 原因 . 

随机 误差 的 存在 干扰 了 我 们 发 现 品种 间 差 别 的 工作 . 两 品种 
间 如 果 虽 有 些 差别 ,但 相对 于 随机 误差 来 说 没有 大 到 一 定 的 程度 ， 
就 可 能 被 随机 误差 所 掩盖 . 品种 间 由 数据 上 显示 的 差别 ,究竟 是 实 
质 性 的 还 是 表面 的 ,只 有 拿 随 机 误差 这 把 尺子 去 衡量 才 有 定 准 . 由 
此 可 多 随机 误差 的 影响 的 估计 的 重要 性 ,而 重复 的 目的 正在 于 此 . 

2. 随机 化 .在 本 试验 中 共有 7 个 小 地 块 .虽然 在 选择 哪 一 大 
块 地 时 我 们 可 能 已 力求 其 各 部 分 条 件 尽 量 均匀 ,但 在 划分 为 元 小 
块 后 ,各 块 的 条 件 总 会 有 些 差别 . 如 果 某 个 品种 正好 分 到 了 条 件 好 
的 那些 小 块 , 则 它 可 能 显示 出 较 高 产量 ,而 这 并 非 由 于 该 品种 优 于 
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其 他 品种 . 

为 了 使 小 块 的 分 配 不 致 因为 人 为 的 因素 而 候 于 某 一 或 茶 些 品 
种 ,我们 采用 前 面 所 描述 的 那 种 随机 化 分 配方 式 , 即 哪些 小 块 分 配 
于 哪些 品种 完全 赁 机 会 .这 种 设计 之 所 以 称 为 "完全 随机 化 ,是 指 
在 分 配 小 块 时 ,除了 随机 化 这 一 原则 外 , 别 无 其 他 条 件 限制 .这 是 
相对 于 有 些 试验 而 言 ,在 那些 试验 中 , 除 随机 化 以 外 ,还 有 别 的 条 
件 限制 小 块 的 分 配 一 一 只 是 部 分 地 随机 化 . 

现在 可 以 说 ,随机 化 这 个 原则 在 统计 学 中 算是 确立 了 .在 其 提 
出 的 早期 ,部 分 地 以 至 于 今 , 并 非 没 有 反对 的 意思 . 支持 随机 化 原 
则 的 主要 理由 有 二 :一 是 人 为 的 选择 并 不 能 保证 有 好 的 效果 ,人 们 
对 各 试验 单元 (在 此 为 各 小 块 ) 的 情况 往往 并 无 充分 了 解 , 甚 至 有 
时 了 解 的 情况 是 错误 的 ;二 是 用 随机 化 设计 所 取得 的 试验 数据 , 往 
往 有 便于 进行 分 析 的 统计 模型 . 

在 本 例 中 ,影响 我 们 感 兴趣 的 指标 一 一 亩 产量 的 因素 只 有 一 
个 , 即 种 子 品 种 .所 考虑 的 不 同 的 种 子 品种 有 个 .每 一 个 具体 的 
品种 ,都 称 为 品种 这 个 因素 的 一 个 “水 平 ”, 故 品种 这 个 因素 一 共有 
个 水 平 .以 此 之 故 , 本 试验 称 为 单 因 素 水 平 的 试验 . n, 称 为 水 
平 i 的 “重复 度 ”. 

如 果 要 考虑 几 种 不 同 的 配方 对 一 种 工业 产品 质量 的 影响 , 则 
是 一 个 以 “配方 "为 因素 的 单 因素 试验 ,有 几 个 配方 参与 试验 ,就 有 
儿 个 水 平 . 如 要 比较 几 种 降 压 药 对 治疗 高 血压 的 作用 , 则 是 一 个 以 
“药品 "为 因素 的 单 因素 试 验 ,水 平 数 就 是 参与 试验 的 药品 数 ,等 
等 .在 实际 问题 中 ,往往 有 若干 个 因素 参与 试验 ,这 时 就 有 多 因素 
试验 , 见 本 节 6.5.3 和 6.5.5. 

6.5.2 单 因 素 完 全 随机 化 试验 的 方差 分 析 

发 问题 中 涉及 一 个 因素 A, 有 个 水 平 ,如 上 例 的 个 种 子 
品种 .以 Y; 记 第 i 个 水 平 的 第 ; 个 观察 值 .如 上 例 ， Y5 征 种 植 品种 
i 的 第 ) 小 块 地 上 的 亩 产量 .模型 为 

YT; = Qa;t ey = 1 ,ni = 1,",k (5.1) 
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a; 表示 水 平 i 的 理论 平均 值 , 称 为 水 平 i 的 效应 , 拿 上 例 来 说 ,a; 
就 是 品种 7 的 平均 亩 产量 ,e; 为 随机 误差 .假定 : 
F(e;) = 0,0 < Var(e;) = 0 < co ,一 切 ej 独立 同 分 布 
(5.2) 
因素 A 的 各 水 平 的 高 低 优 劣 ,取决 于 其 理论 平均 a; 的 大 小 . 
故 对 模型 ($5.1) ,我 们 头 一 个 关心 的 事情 ,就 是 诸 a; 是 否 全 相同 . 
如 采 是 , 则 表示 因素 A 对 所 考察 的 指标 Y 其 实 无 影响 . 这 时 我 们 
就 说 因素 A 的 效应 不 显著 ,否则 就 说 它 显 著 . 当然 ,在 实际 应 用 
中 ,所 请 "显著" ,是 指 诸 w 之 间 的 差异 要 大 到 一 定 的 程度 . 这 个 
一 定 的 程度 ,是 从 其 实用 上 的 意义 着 眼 , 而 “统计 显著 性 ”, 则 是 
与 随机 误差 相 比 而 言 .这 一 点 在 下 文 的 讨论 中 会 有 所 体现 .我 们 把 
所 要 检验 的 假设 写 为 
Ho:al! = a;= -= a, (5.3) 
为 检验 这 个 假设 ,我 们 作 如 下 的 分 析 :(5.1) 中 全 部 n=) 十 
… 十 nn4 个 观察 值 各 不 相同 . 为 什么 各 Y; 的 值 会 有 差异 ? 从 模型 
(5.1) 看 ,不 外 平 两 个 原因 :一 是 各 a; 可 能 有 差异 . 例如 , 若 
a1 这 a3, 这 就 使 YVv 倾 问 于 大 于 Y2 .二 是 随机 误差 的 存在 .这 一 分 
析 局 发 了 如 下 的 想法 : 找 一 个 衡量 全 部 Y; 的 变异 的 量 , 它 自然 地 
取 为 (7 三 771 十 "… 十 ny,) 


SS = WY (YY) FY DV yh (5.4) 


i=1 j=1 i=1 j=1 
SS 人 鳃 大 ,表示 Yi 之 间 的 差异 愈 大 .然后 ,设法 把 SS 分 解 为 两 部 
分 ,一 部 分 表示 随机 误差 的 影响 , 记 为 SS,; 一 部 分 表示 因素 A 的 
I ,Qk 之 不 同 带 来 的 影响 , 记 为 SS，. 
SS。 这 一 部 分 可 如 下 分 析 :; 固定 一 个 i ,考虑 其 一 切 观察 值 
Yi1, ye Yi .它们 之 间 的 差异 与 诸 a; 之 不 等 无 关 , 而 可 以 完 


全 委 之 于 随机 误差 .反映 Y;1,…, Yi 的 差异 程度 的 量 是 SCY, 
一 立 ) ,其 中 
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Yi= (Yate + Ya)/ni,i = 1,%,k (5.5) 
YY; 是 水 平 i 观察 值 的 算术 平均 , 它 可 以 作为 ai 的 合计 .把 上 述 平 
方 和 对 i 相 加 ,得 


SS, = 2 2 Ys- Yi) (5.6) 
ss, 就 是 SS 与 SS, 之 差 .可 以 证 明 
SS = SS - SS, = Vil. -YY (5.7) 
为 证 尼 式 ,只 有 把 分 包 | 
Yiy—- Y= (Y,- Y)+(Y,—Y) 


两 边 平 方 ， 二 求 和 ,注意 
3 YD- 0 -了 (Y, - Y,)=0 


然后 对 i 二 1,…,k 求 和 即 可 . 细 察 SSa 的 表达 大 式 ,这 确 可 以 用 于 
衡量 诸 a; 之 间 的 差异 程度 . 因 Y, 是 a, 的 鸽 计 ,a, 之 间 差 异 愈 大 ， 
Y 之 间 的 差异 也 就 倾向 于 大 ,而 由 (5.7) 式 看 出 ,SS 之 值 也 会 倾 
回 于 大 . 

在 统计 学 上 通常 把 上 文 的 SS 称 为 “总 平方 和 ”, SSa 称 为 “ 因 
素 A 的 平方 和 ”, SS。 称 为 “误差 平方 和 ”. 而 分 解 式 -SS = SSa + 
SS. 承 称 为 (本 模型 的 ) 方差 分 析 .名 称 的 来 由 显然 : 像 SS， 
SSa ,SS。 这 种 表达 式 ,都 是 属于 样本 方差 那 一 类 的 形状 . 

从 上 面 的 分 析 就 得 到 假设 (5.3) 的 一 个 检验 法 ; 当 比 值 
SSa ASS。 大 于 某 一 给 定 界 限时 ,否定 Ho ,不然 就 接受 Ho. 为 了 根 
据 所 给 的 检验 水 平 a 确定 这 一 界限 ,要 假定 随机 误差 ej 满足 正 态 
分 布 N(0,c-). 可 以 证 明 , 若 记 

AMS4 = SSa/(k ~ 1),MS, = SS Am —k) (S.8) 
则 在 正 态 假定 之 下 且 当 五 ,成 立时 ,有 
AMSaA7AAMS 一 FT (S.9) 
据 (5.9), 即 得 (5.3) 的 假设 Fo 的 检验 如 下 : 


河 AMSWLWMS 和 天 Tea) 时 ,接受 万 ,不 然 就 否定 万 0 
(5.10) 
这 检验 称 为 (5.3) 的 斑 检 验 , 名 称 显然 来 由 于 (4.31). 
(3.8) 式 中 的 MS 和 MS, ,分 别称 为 因素 A 和 随机 误差 的 
“平均 平方 和 ”. 被 除数 &-1 和 7 一 ,分 别称 为 这 两 个 平方 和 的 
自由 度 . MS, 的 自由 度 为 n 一 比较 好 理解 , 因 按 以 前 多 次 指出 


的 :平方 和 NCY; - 台 关 的 自由 度 为 同一 1, 故 对 守 求 和 ,得 自由 
度 (40 一 ++ (N61) 二 1- 名 . MS， 自由 度 为 -1. 初 看 
好 像 难 于 理解 ,因为 一 共有 上 个 平均 值 a ,…, a .但 我 们 重视 的 
是 它们 之 间 大 小 的 比较 ,因此 ,不 同 的 有 关 量 其 实 只 有 4a， -~ a， 
aaly ee 一 ai 以 al 为 基准 ) 等 &-1T 个 , 故 自由 度 只 应 为 
&R 一 1. 二 者 自由 度 之 和 为 (2 一 上 )+(&k 一 1)=nn 一 1, 恰 好 是 总 平方 
和 的 自由 度 . 
在 统计 应 用 上 常 把 上 述 计算 列 成 表格 , 称 为 方差 分 析 表 
表 6.1 单 因 素 完全 随机 化 试验 的 方差 分 析 表 


项 日 SS 自由 度 MS Ft 比 显著 性 
A( 例 如 ,品种 ) SSA kg-l MS MSa/MS,  *,x* ,或 无 

误 差 SS, nk MS, 一 一 

总 和 SS 2 一 1] 一 一 一 


表 6.1 中 的 各 栏 , 除 显著 性 一 栏 外 ,都 已 解释 过 了 .显著 性 一 
栏 是 这 样 的 :把 算出 的 下 比 , 即 MS4 /MS,, 与 到- ,4(0.05)= 
cl 和 五-1,, (0.01)=cs 比较 .车 下 比 >cy, 用 双星 “x x ”, 表 示 
A 这 个 因素 的 效应 “高 度 显 著 " ,意思 是 ,即使 指定 a =0.01 这 样 
的 检验 水 平 , 原 假设 (5.3) 也 要 被 否定 . 如 果 cj< 下 比 委 c, 则 用 
一 个 星 %* "表示 A 的 效应 “显著 ”, 意 即 在 a =0.05 的 水 平 上 , 原 
假设 (4.25) 要 被 否定 .如 果 下 比 过 cj, 则 不 加 “x ”( 显 著 性 一 栏 空 
者 ) ,表示 因素 A 的 效应 “不 显著 ”. 当然 ,这 里 用 的 a =0.05,0.01 

”338 ， 


是 比较 通用 的 习惯 ,并 非 一 定 要 如 此 不 可 .应 用 者 可 根据 特定 的 需 
要 改 用 其 他 值 ,如 (0.05,0.10),(0.10,0.20),(0.001,0.01) 等 . 
例 $.1 设 上 述 品 种 试验 中 ,包含 有 上 有 =3 个 品种 ,分 别 重 复 
4.3 和 和 3 次 ,数据 为 (单位 : 斤 / 亩 ) 
品种 1: 390 ,410 ,372 ,385， 
品种 2; 375 ,348 ,3S4 ,364 ,362. 
品种 3: 413 ,383 ,408. 
全 部 12 个 数 的 算术 平均 为 380.33. 总 平方 和 为 
SS =(390 — 377) + (410 ~ 377)> + + (408 - 377)? 
=5274:67 
其 自由 度 为 12 一 1=11. 
3 个 品种 各 目 数 据 的 算术 平均 ,分 别 为 389.25,360.60 和 
401.33. 因 此 算出 误差 平方 和 为 
SS. = (390 - 389.25) + + (385 — 389.25)’ 
+ (375 - 360.60)2 + … + (362 - 360.60)? 
+ (413 - 401.33)2 + -… + (408 - 401.33)? 
=1686.62 
其 自由 度 为 n--k=12--3=9. 
品种 平方 和 SS 可 由 SSA = SS - SS, 算出 .但 为 了 验算 , 常 
单独 算出 ,再 验证 式 子 SS = SS + SS, 是 否 成 立 ( 由 于 计算 中 取 
的 位 数 有 限 , 不 一 定 严 格 相 同 ). 如 果 不 成 立 , 就 表示 计算 中 有 错 
误 , 必 须 从 头 查 一 查 .对 此 例 按 (4.29) 有 
SS =4 x (389.25 - 380.33)* + 5 x (360.60 - 380.33)? 
+ 3x (401.33 - 380.33)2 = 3588.05 
自由 度 为 3 一 1=2. 于 是 
MSa = 3588.05/ 2 = 1794.03, MS, = 1686.62/9 = 187.40 
因素 A 的 已 比 为 
MSa /MS, = 1794.68/187.40 = 9.00 
碍 表 得 Fz,%(0.05)=4.26,F (0.01)=8.02. 因 9.00>8.02, 故 
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种种 效应 是 高 度 显 若 的 .以 上 计算 结果 列 成 方差 分 析 表 如 下 : 


项 日 SS 自 和 出 度 MS FF 比 显 黄 性 
各 3388.03 2 1794.68 9.00 和 共 

以 交 1686.62 9 187.40 一 

总 和 5274.67 11 一 -一 


检验 的 结果 表明 : 不同 品 种 的 产量 之 问 的 差异 ,在 统计 上 高 度 显 
背 . 

就 本 例 而 言 ,如 检验 的 结果 不 显著 , 则 一 - 般 就 不 再 作 进 一 步 的 
分 析 了 .因为 ,既然 假设 (5.3) 被 接受 ,各 品种 的 效果 视 作 同一 ,也 
束 没 有 多 少 好 说 的 了 .但 在 实际 工作 中 ,最 好 还 不 这 人 委 简 单 地 下 结 
论 . 有 两 点 还 可 以 考察 一 下 

1 . 各 水 平 理 i g 平 均值 的 点 估计 这 之 闻 的 差异 如 何 . 
右 这 个 差异 没有 大 到 有 实际 意义 的 程度 , 则 加 强 了 上 述 结论 , 即 各 
自 种 同 的 差异 ,即使 存在 ,其 实际 意义 也 很 有 限 . 

2. 车 了 1,…, YY 的 差异 ,从 应 用 观点 看 ,达到 了 比较 重要 的 
程度 , 则 原 假 设 (5.3) 之 被 接受 ,是 由 于 随机 误差 的 影响 太 大 .误差 
方差 o- 的 -一 个 无 偏 估 计量 是 MS,. 可 以 考察 -一 下 v MS. 之 值 . 若 
从 应 用 的 角度 看 这 个 值 太 大 , 则 看 来 本 试验 在 精度 上 欠 理 想 一 一 
这 个 止 是 (5.3) 的 检验 问题 ,还 有 下 文 要 谈 到 的 区 间 估 计 问 题 .这 
时 ,如 条 件 人 允许 ,应 考虑 增 大 试验 规模 ,以 及 改进 试验 以 图 尽量 缩 
小 随机 误差 的 影响 . 

如 林 检 验 的 结果 为 显著 ， 则 等 于 说 有 充 驳 分 理由 相信 各 理论 
均值 41,…,ax 并 不 全 相同 .但 这 并 不 是 说 它们 中 一 习 没 有 术语 
的 .如 &=3 时 ,可 能 wu 与 a 之 间 差 别 不 显著 ,而 它们 与 a3 之 问 
了 差别 显著 .就 指定 的 -一 对 dxsd 之 则 的 比较 ,5 可 通过 求 a, -- 

的 区 间 佑 计 . 方 法 如 下 : 按 (5.2) 及 @， ;服从 正 态 分 布 的 假定 ， 不 鸡 
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LY, | Y, ) 加 (au cj La 一 N(0,1) 


记 52= MS,,67 为 co 的 无 偏 估 计 . 以 5 代替 上 式 中 的 c, 可 以 证 明 


| 


Ni LY, YY) ao ~ Lk (5.11) 


71, 二 天 


由 此 出 发 ,就 得 出 a 一 a, 的 置信 系数 1 一 a 的 置信 区 间 是 


fn 十 7 
(Yu Y..) 和 < Un Wr 
AT 2 
-一 -一 N+ 2, 
L(Y YY) + 下 3) (5.12) 
77 ,7 2 


取 vc=0.05 ,算出 本 例 中 各 a, 一 a 的 区 间 估 计 为 

41 一 ar:28.639 十 16.90 

a;3— al: 12.08 + 23.65 

da3 — a2: 40.73 + 22.02 
第 一 和 第 三 个 区 间 不 含 0 且 全 在 0 的 右边 ,这 显示 a3 和 al 都 在 
给 定 的 水 平 c=0.03 上 显著 地 大 于 az. 第 二 个 区 间 包 含 0. 放 虽然 
从 点 估计 上 看 as 大 于 ai ,但 在 0.0S 的 水 平 上 达 不 到 显著 性 .所 
以 , 单 从 统计 分 析 的 角度 看 ,如 果 要 在 品种 1,2,3 中 挑 一 个 最 好 
的 , 则 除 品 种 2 外 ,品种 1、3 都 可 考虑 .因为 毕竟 a; 的 点 估计 大 于 
ai 的 点 估计 , 厂 无 其 他 的 特殊 理由 ,我 们 就 宁肯 挑 品种 3. 

读者 想必 已 注意 到 ;区间 合计 (5.12) 与 第 四 间 中 所 讲 的 两 样 

本 + 区 间 估 计 基 本 上 一 致 ,不 同 之 处 在 于 :这 里 误差 方差 o7 的 估 
计 3? 用 到 了 全 部 样本 ,而 不 只 是 YY 及 YY .如 
果品 种 数 很 多 ， 则 涉及 的 相互 比较 非常 之 多 .例如 , 若 有 5 个 品 


则 总 共 将 涉及 | > } = 140 组 比较 即 有 10 个 区 间 估 计 要 做 . 这 不 仅 


很 不 方便 ,而 且 理 论 上 也 有 问题 .问题 在 于 : 虽 则 对 一 对 固定 的 w， 
v ,置信 区 间 (5.12) 成 立 的 概率 为 1 一 a, 但 多 个 区 间 ( 每 个 区 间 的 
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概率 为 1 一 a) 辐 时 成 立 的 概率 就 会 小 于 1 一 a. 区 间 数 鳃 多 ,差距 
例 大 ,例如 , 取 5 个 品种 ,有 10 组 a 一 a, 要 作 区 间 估 计 , 厂 每 个 区 
问 估 计 的 置信 系数 为 0.95, 则 这 10 个 区 间 估 计 同 时 都 包含 所 要 
估计 的 参数 的 概率 ,将 降 至 0.6 左右 .为 了 克服 这 一 困难 ,统计 学 
中 引进 了 一 种 叫做 ”多重 比 较 法 "的 方法 , 它 考虑 到 了 上 面 指出 的 
那个 问题 . 这 个 内 容 已 超出 本 书 范围 之 外 ,不 能 在 此 介绍 了 . 


6.5.3 两 因素 完全 试验 的 方差 分 析 


一 般 情 况 下 ,在 一 个 试验 中 要 考虑 好 几 个 对 指标 可 能 有 影响 
的 因素 .例如 在 -项 工业 试验 中 ,影响 产品 质量 指标 Y 的 因素 可 
能 有 反应 温度 反应 压力 .反应 时 间 和 某 种 催化 剂 的 添加 量 . 若 反 
应 温度 有 Al 个 不 同 的 可 能 选择 ,其 他 三 个 因素 分 别 有 马 ,上 ， 和 
&4 种 不 同 的 选择 , 则 可 供 选 择 的 试验 组 合 一 共有 | XX ksX ks 
种 ,而 这 个 试验 也 就 称 为 一 个 Xk,XxX 上 Xk 试验. 如果 每 一 可 
能 的 组 合 都 做 一 次 试验 , 则 试验 称 为 是 “完全 ”的 ,车 只 对 一 部 分 组 
合 做 试验 , 则 称 为 “部 分 实施 ”. 在 实际 应 用 中 部 分 实施 很 常见 ， 
为 完全 试验 往往 规模 太 大 ,为 条 件 所 不 允许 , 且 有 时 并 无 必要 .要 
作 部 分 实施 ,就 有 一 个 如 何 去 选 择 那 些 实际 进行 试验 的 组 合 的 问 
题 .这 里 面 有 很 多 数学 和 统计 问题 ,它们 构成 “试验 设计 ”这 门 学 科 
的 主要 内 容 之 一 .本 节 的 第 6.5.5 小 节 与 这 个 内 容 有 关 . 

这 种 试验 ,不 论 是 完全 试验 或 部 分 实施 ,都 有 一 个 随机 化 的 问 
题 (或 分 区 组 的 问题 ), 见 6.5.4 小 节 . 如 在 上 述 工业 试验 中 , 若 全 
部 试验 要 由 几 个 人 和 几 台 设备 去 做 , 则 因 人 的 技术 和 操作 水 平 有 
差异 ,设备 性 能 优 劣 有 差异 ,需要 用 在 前 面 描述 过 的 随机 化 方法 ， 
把 要 做 的 试验 随机 地 分 配给 这 几 个 人 和 几 台 设备 . 

为 书写 简便 计 , 这 里 我 们 讨论 两 因素 完全 试验 的 情况 . 设 有 两 
内 系 A ,B, 分 别 有 &,/ 个 水 平 (例如 A 为 品种 ,有 上 个 ;B 为 播种 
量 , 考 虑 / 种 不 同 的 数值 ,如 20 斤 / 亩 ,25 斤 / 亩 ,……… ). A 的 水 平 
与 B 的 水 平 i 的 组 合 记 为 (i,j), 其 试验 结果 记 为 Yj;,i=1,…, 
,j= 二 1,…, 7. 统计 模型 定 为 
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Yjy=p+ta;t+b;t+er,i=1,,k,7=1,…,/ (5.13) 
为 解释 这 模型 ,首先 把 右边 分 成 两 部 分 :ej 为 随机 误差 , 它 包 含 了 
未 加 控制 的 因素 (A ,B 以 外 的 因素 ) 及 大 量 随机 因素 的 影响 . 候 定 

E(e;)=0,0<Var(e;)=o <%, 全 体 ej 独立 (5.14) 
刃 一 部 分 jy 二 a;++b;, 它 显示 水 平 组 合 (i,j) 的 平均 效应 . 它 又 分 
解 为 三 部 分 :py 是 总 平均 (一 切 水 平 组 合 效 应 的 平均 ), 是 一 个 基 
准 .a; 表示 由 A 的 水 平 i 带 来 的 增加 部 分 .a, 愈 大 ,表示 因素 A 
的 水 平 i 愈 好 ( 设 指标 愈 大 愈 好 ) , 故 a; 称 为 因素 A 的 水 平 i 的 效 
应 .oj 有 类 似 的 解释 .调整 w 之 值 ,我 们 可 以 补充 要 求 : 

QZ1 二 十 三 UpI+ 二 TD 三 (0 (5.15) 

事实 上 ,如 (5.15) 不 成 立 , 则 分 别 以 a 和 4 记 各 a; 的 平均 值 和 
各 已 的 平均 值 ,把 ww 换 为 六 十 a 十 b ,a, 换 为 ai; 一 工 ,DO 换 成 入 一 
b , 则 (5.13) 式 不 变 , 而 (5.15) 成 立 . 

约束 条 件 (5.15) 给 了 a; ,6b; 的 意义 一 种 更 清晰 的 解释 : a, >0 
表示 A 的 水 平 i( 的 效应 ) 在 A 的 全 部 水 平 的 平均 效应 之 上 ,a < 
0 则 相反 .另外 ,这 个 约束 条 件 也 给 了 y,a; 和 2 的 一 个 适当 的 估 
计 法 :把 Y 对 一 切 z,7 相 加 .注意 到 (5.15), 有 


{ ! 
oY = p+ DY, 


因 上 式 右边 第 一 项 有 均值 0, 即 知 
Y = 2 2 Ys /kl (5.16) 
是 5 的 一 个 无 偏 估 计 . 其 次 ， 有 


‘ 
Sy, = luntilat se 
j=1 j=1 


于 是 , 记 
-> Yay/l,Y., = > Y;/k (5.17) 
知 Yj. 为 y+a; 的 一 一 个 无 偏 估计 . 于 是 得 到 a; 的 -一 个 无 偏 估计 为 
2 YY 1 (S.18) 
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问 法 得 到 5b; 的 一 个 无 偏 估计 为 


B= YY -Y ,= 1,,/ (5.19) 


它们 适合 约束 条 件 :&1 +… 二 &, = 二 0,61+…+6,=0. 
下 面 要 进行 方差 分 析 , 即 要 设法 把 总 平方 和 
so Y ) 
分 解 为 三 个 部 分 : SS , SS， 和 SS, ,分别 表示 因素 A,B 和 随机 误 
差 的 影响 . 这 种 分 解 的 主要 目的 是 检验 假设 : 
OA:cl 三 二 二 0 (S$.20) 
和 
Hop:bi1 =*…=6,=0 (5.21) 
Hoa 成 立 表示 因素 A 对 指标 其 实 无 影响 .在 实际 问题 中 ,绝对 无 影 
响 的 场合 少见 ,但 如 影响 其 小 以 致 被 随机 误差 所 掩盖 时 ,这 种 影响 
事实 上 等 于 没有 .因此 , 拿 SS 和 SS, 的 比 作 为 检验 统计 量 正 符 
一 想法 . 
所 要 作 的 分 解 可 如 下 得 到 :把 Y; 一 YY 写 为 
Yj—-Y =(Y.-Y)+(Y.,-Y) 
t+(Y;—-Y.—Y.+Y.) (5.22) 
两 边 平方 ,对 i,j; 求 和 .注意 到 


二 4 
> (YY -Y)=0,> (7r, -YY )=0 
i 1 j=1 


> (Yjy- Yi.-Y.,+Y) 
-Dy- -Yj+tY.)=0 
即 知 所 有 交 文 积 之 和 和 皆 为 0, 而 得 到 


. ! 
SS oy, -YY +k (YY -YY ) 
:二 1 
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= SSa + SSp + SS, (5.23) 

第 一 个 平方 和 可 以 作为 因素 A 的 影响 的 衡量 ,从 表述 Y;. 一 Y 
作为 a; 的 估计 可 以 理解 .第 二 个 平方 和 同样 解释 .至 于 第 三 个 平 
方 和 可 作为 随机 误差 的 影响 这 一 点 ,直接 看 不 其 明显 .可 以 从 两 个 
角度 去 理解 :在 SS 中 去 掉 SS 和 SS 后 ,剩余 下 的 再 没有 其 他 系 
统 性 因素 的 影响 , 故 只 能 作为 SS, .另外 ,由 模型 ($.13) 及 约束 条 
件 (5.15), 易 知 

Yi Yi Y.;)+Y.=ey-e.-e.;+e, (5.24) 
这 里 面 已 党 无 pa, 的 影响 ,而 只 含 随机 误差 . 

读者 可 能 不 很 满足 于 上 面 的 推导 , 即 怎 么 想到 把 Y, -~ Y 拆 
成 (5.22) 式 而 得 出 (5.23)? 对 此 ,我 们 的 回答 是 : 

1. 并 非 在 任何 模型 中 总 平方 和 SS 都 有 适当 的 分 解 ,3 这 要 看 
设计 如 何 .比方 说 ,如 在 全 部 gi 个 组 合 中 少 做 了 1 个 ( 即 有 一 
Yj; 未 观察 ), 则 分 解 式 作 不 出 来 . 

2. 在 能 进行 分 解 时 ,方差 分 析 提 供 了 进行 分 解 的 -一 般 方 法 . 
使 用 这 个 一 ye 23). 但 是 ,由 于 在 本 模型 下 通过 
(5.22) 更 易 实 现 ,我 们 就 不 用 这 一 般 方 法 

得到 分 解 式 (323) 后 我 们 训 林 以 公 间 因 表 入 各 至 出 
面 的 方差 分 析 表 : 

SSa ,SS 目 由 度 分 别 为 其 水 平 数 减 去 1, 这 一 点 与 单 因 素 情 
帝 相 同 .总 和 自由 度 为 全 部 观察 值 数 自 kl/ 减 去 工 剩 下 的 就 是 误 
差 平 方 和 自由 度 : 

(KL —1)- (km1)-(/-1)=(k-1)(/-1) 
MS 灰 是 SS 际 以 其 自由 度 . 显著 性 的 意义 也 与 单 因 素 的 情况 相 
同 .如 果 A 那 一 行 的 显著 性 位 置 标 上 了 一 个 星 号 , 即 表示 在 水 平 
0.05 之 下 原 假 设 Hoa 被 否定 .双星 则 相当 于 水 平 0.01, 称 为 高 度 
显著 .如 以 前 兽 指 出 过 的 ,0.05 和 0.01 这 两 个 数字 只 是 一 种 习 
惯 ,不 - : 定 拘泥 . 
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表 6.2 两 因素 完全 试验 的 方差 分 析 表 


项 月 SS 目 由 度 MS FF 比 显 苦 性 
] 
1 SS， pl] MSi MSA/MS, | 加 **", 
B SSp 7 一 ] ATS) MSp/MS, | “x "或 不 加 
误差 S95, (k—1)(/—1) MS., 一 一 
总 和 SS ki-1 一 一 一 


例 5.2 在 一 个 农业 试验 中 ,考虑 4 种 不 同 的 种 子 品 种 (k= 
4) 和 3 种 不 同 的 施肥 方法 (!=3). 试验 数据 为 (单位 : 斤 / 亩 ): 


品 此 方法 1 2 3 
种 

I 292 316 325 

2 310 318 317 

3 320 318 310 

4 370 365 330 


算出 
Y.. = 324.25,Y1. = 311,Y;. = 315,Y3. = 316, Yy. = 355 
Y1= 323, Y,= 329.25, Y ;= 320.50 
SS = (292 - 324.25) + … + (330 - 324.25)? = 5444.75 
SSa =3[(311 - 324.25)? + … + (355 — 324 .25)?] 
=3824.25 
SSp =4|(323 ~ 324.25)? + … + (320.50 — 324.25)?] 
= 162.50 
SS, = 5444.75 — 3834.25 - 162.50 = 1458 
列 出 方差 分 析 表 如 下 : 


项 日 SS 自由 上 度 MS F 比 显 着 性 
A( 品 种 ) 3824.25 3 1274.75 5.246 x 
B{ 施 肥 法 ) 162.50 2 81.25 0.344 

误 差 1458 .00 6 243.00 一 

总 和 5444.75 11 一 一 
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只 有 品种 因素 达到 了 显著 性 ,而 “施肥 方法 "这 个 因素 未 达到 
显著 性 .在 a=0.0S 的 水 平 上 ,没有 充分 证 据 证 明 : 不 同 的 施肥 法 
对 产量 有 显著 的 影响 . 

任 一 因素 两 个 不 同 水 平 的 效应 差 的 区 间 估 计 , 与 (5.12) 相 似 . 
此 处 更 简单 一 些 ; 如 佑 计 的 是 a, 一 a,, 则 三 ?= 如 估计 的 是 
一 0 , 则 =72=R. 仍 是 (MS.) 一 当 R 或 7 较 大 时 ,涉及 的 
比较 为 数 甚 多 ,因而 也 存在 单 因 素 情况 下 曾 指出 的 那 种 问题 . 

应 用 上 的 一 个 重要 问题 ,是 选择 一 个 水 平 组 合 (i,;), 使 其 平 
均 产 量 w+ a;+b; 达到 最 大 .选择 的 方法 如 下 :如 在 本 例 ,因素 A 
的 效应 显著 , 则 选 i ,使 a; 在 cai, ,as 中 达到 最 大 . 从 统计 上 说 ， 
右 a; 和 a, 的 差异 不 显著 ( 即 a 一 a, 的 区 间 估 计 包 含 0), 则 选 a, 
也 可 以 .但 知 无 特别 理由 ,总 是 选 使 a1,…,as 达到 最 大 的 那个 i 
因素 B 的 效应 不 显著 . 故 从 统计 上 说 ,选择 其 任 一 水 平 ; 都 可 以 . 
但 一 般 如 无 特殊 原因 ,总 是 选 ;, 使 5; 在 5,…,6b, 中 达到 最 大 . 拿 
本 例 来 说 ,应 选取 i =4,; =2. 注 意 在 Ya,Yp, Yo 中 ,最 大 的 并 
非 Yw 而 是 Ya. 

还 有 一 点 要 注意 :在 采纳 模型 ($.13) 时 ,我 们 事实 上 引进 了 一 
种 假定 , 即 两 因素 A ,B 对 指标 的 效应 是 可 以 亚 加 的 . 换 一 种 方式 
说 :因素 A 的 各 水 平 的 优 劣 比较 ,与 因素 B 处 在 哪个 水 平 无 关 ， 
有 反之 亦 然 .更 一 般 的 情况 是 :A,B 两 因子 有 “交互 作用 ” 这 时 在 模 
型 (5.13) 中 ,还 要 加 上 表示 交互 作用 的 项 c,. 这 时 不 仅 统 计 分 析 
复杂 化 了 ,尤其 是 分 析 结 果 的 解释 也 复杂 化 了 .本 书 不 涉及 这 种 情 
沈 . 在 一 个 特定 的 问题 中 ,交互 作用 是 否 需 要 考虑 ,在 很 大 程度 上 
取决 于 问题 的 实际 背景 和 经 验 . 有 时 ,通过 试验 数据 的 分 析 也 可 以 
看 出 一 些 问 题 . 例 如, 若 误差 方差 a? 的 估计 MS, 反常 地 大 , 则 有 
可 能 是 由 于 交互 作用 所 致 .因为 可 以 证 明 : 若 交互 作用 确实 存在 而 
未 加 考虑 , 则 它 的 影响 进入 随机 误差 而 增 大 了 MS.. 


6.5.4 单 因素 随机 区 组 试验 的 方差 分 析 


在 本 让 46.5.1) 段 中 ,我们 讲述 了 费 软 尔 的 试验 设计 三 原则 中 
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的 两 个 , 即 重 复 和 随机 化 .第 三 个 原则 是 “分 区 组 ”, 就 是 我 们 现在 
要 介绍 的 . 

为 解释 “区 组 ”这 个 概念 ,看 一 个 稀 单 例子 . 设 有 一 个 包含 3 个 
品种 的 试验 ,每 个 品种 重复 5 次 .于 是 一 共 要 准备 15 小 块 形状 大 
小 -- 样 的 田地 .这 些 地 可 能 散布 在 一 个 很 大 的 范围 内 ,因而 各 小 块 
的 条 件 会 存在 较 大 的 差别 ,以 致使 试验 误差 加 大 . 固然 我 们 可 以 通 
过 完全 随机 化 的 方法 保证 不 发 生 人 为 的 系统 性 偏差 ,但 这 并 不 能 
克服 由 于 这 15 小 块 的 内 在 不 均匀 性 而 带 来 的 误差 ， 

因此 我 们 考虑 如 下 的 设计 ,选择 5$ 个 村 子 ,每 个 村 准备 3 小 块 
地 ,条 件 尽 可 能 均匀 ,但 不 同村 的 地 块 在 条 件 上 可 以 有 较 大 的 差 
别 .由 于 3 这 个 数字 较 小 ,准备 3 小 块 相 当 均 匀 的 地 块 , 比 之 准备 
15 小 块 均匀 地 块 ,就 更 容易 做 到 . 

然后 我 们 让 每 个 品种 在 每 个 村 子 里 的 3 小 块 中 各 占 一 块 , 哪 
个 品种 占 哪 一 块 由 随机 化 决定 . 这样 ,我 们 就 有 一 种 不 完全 的 随机 
化 :每 个 村 子 中 的 3 块 地 必须 种 3 个 品种 ,这 一 条 不 能 变 ( 如 用 完 
企 随机 化 ,有 可 能 某 个 品种 在 某 个 村 子 里 占 2 或 3 块 ), 但 在 回 一 
村 子 里 则 用 随机 化 . 

间 一 村 子 里 的 3 小 块 地 ,就 构成 一 个 区 组 ,区 组 的 大 小 ,在 本 
倪 中 即 小 块 地 的 数目 ,为 3. 它 正好 等 于 品种 这 个 因素 的 水 平 数 . 

上 述 设计 就 叫做 “随机 区 组 设计 ”“ 随 机 ”的 含义 是 在 每 个 区 
组 内 实行 随机 化 .这 设计 的 优点 ,从 本 例 中 看 得 很 清楚 :由 于 每 个 
名 种 在 5 个 村 子 里 各 占有 一 块 ,即使 各 村 子 之 间 有 较 大 差异 ,也 不 
会 使 任 一 品种 有 利 或 不 利 , 因 此 可 以 缩小 误差 . 

一 般 地 ,区 组 就 是 一 组 其 条 件 尽 可 能 均匀 的 试验 单元 .区 组 大 
小 , 即 所 含 试 验 单元 个 数 , 等 于 所 考察 的 因素 的 水 平 数 * ,因而 在 
每 -区 组 内 ,各 水 平 都 可 以 实现 一 次 晶 仅 一 次 .在 区 组 内 实行 随机 
化 .区 组 的 数 自 则 没有 限制 ,可 多 可 少 . 


。 满足 这 条 件 的 区 组 称 为 "完全 区 组 ”也 可 以 考虑 这 祥 的 设计 ,其 区 组 大 小 , 即 所 
含 试验 单元 数 , 比 因素 水 平 数 少 . 这 种 区 组 称 为 "不 完全 区 组 ”, 其 设计 问题 很 复杂 
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区 组 的 例子 很 多 .例如 ,要 比较 一 种 产品 的 4 种 不 同 的 配方 ， 
每 配方 重复 5 次 ,一 - 共 作 20 次 .如 果 由 5 个 人 操作 , 则 考虑 到 各 人 
操作 水 平 不 同 而 带 来 的 误差 ,可 让 每 一 个 人 对 这 4 个 配方 都 操作 
一 次 ,抵消 人 的 影响 ,这 时 ,可 以 运 直 把 每 个 人 看 作 一 个 区 组 (严格 
地 说 ,是 每 人 所 做 的 那 4 个 配方 构成 一 区 组 ); 为 要 比较 一 种 病 的 
几 种 治疗 方法 ,要 对 一 些 患 者 作 临 床 试验 .病情 不 同 , 病 人 年 龄 . 身 
体 条 件 等 的 不 同 ,会 带 来 误差 . 因此 要 把 病人 分 组 :条 件 尽 可 能 相 
似 的 病人 分 在 一 组 ,病人 个 数 即 治 疗 方法 个 数 , 在 每 一 组 内 ,每 个 
治疗 方法 施加 于 -个 病人 (用 随机 化 ) 时 ,每 一 组 病人 就 构成 一 个 
区 组 ,等 等 . 

随机 区 组 试验 的 统计 分 析 ,与 上 段 讲 的 两 因素 试验 完全 一 样 ， 
只 消 把 其 中 的 一 个 因素 看 作 是 区 组 就 行 .例如 因素 A 有 & 个 水 
平 ,每 水 平 做 / 次 试验 ,分 / 个 区 组 (每 区 组 大 小 为 &) .以 Y;; 记 因 
素 A 的 水 平 z 在 第 7) 个 区 组 内 的 试验 值 (例如 ,第 i 个 种 子 品种 在 
第 j 个 村 子 里 那 小 块 上 的 亩 产量 ), 则 有 模型 (5.13) ,其 中 ,a;,e; 
的 意义 同 前 ,而 5; 则 称 为 (第 j 个 区 组 的 六 区 组 效应 ”, 意 思 是 第 ; 
个 区 组 优 于 和 劣 于 全 部 区 组 的 平均 的 量 . 拿 上 述 品 种 试验 来 说 , 若 
条 个 村 子 田 地 条 件 特别 好 , 则 该 村 子 ( 区 组 ) 的 5 值 就 高 . 这样 , 表 
6.2 的 方差 分 析 表 ,及 其 计算 过 程 ,完全 适用 于 此 处 . 所 不 同 的 是 
现在 因素 B 解释 为 区 组 ,而 SSp 则 是 “区 组 平方 和 ” 

由 于 我 们 所 关心 的 只 有 一 个 因素 A, 故 在 方差 分 析 表 6.2 
中 ,我 们 首先 感 兴 趣 的 是 因素 A 的 效应 是 否 达 到 显著 .但 区 组 效 
应 是 否 达到 显著 也 有 一 定 的 意义 : 它 表 明 区 组 的 划分 是 否 成 功 ( 即 
是 否 有 达到 了 如 下 的 要 求 :区 组 内 各 试验 单元 很 均匀 ,而 不 同 区 组 
内 的 试验 单元 则 有 较 大 差异 ). 如 区 组 效应 达到 显著 , 则 表明 区 组 
划分 至 少 有 一 定 的 效果 ,和 否则 就 难说 ,甚或 可 能 有 反 效 果 . 这 个 问 
题 我 们 上 略 多 说 几 句 .车 在 (5.13) 中 去 掉 标志 区 组 的 那 一 项 5, 即 
当成 一 个 完全 随机 化 的 模型 去 分 析 , 则 SS 和 SS 仍 不 变 , 而 SS。 
则 将 成 为 (5.23) 式 中 的 SSg 与 SS, 之 和 .由 此 看 出 :如 果 MS,< 
MS。( 指 表 6.2 中 的 MS,), 则 在 完全 随机 化 模型 之 下 误差 方差 的 
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估计 ,反而 比 在 随机 区 组 设计 之 下 为 低 , 再 加 上 自由 度 的 损失 ( 完 
全 随机 化 设计 之 下 ,误差 方差 估计 的 自由 度 为 &(/ 一 1), 而 在 随机 
区 组 设计 之 下 只 有 (&- 1)( 一 1)), 就 使 A 入 比 要 达到 显著 性 
更 难 , 即 :如 果 因 素 A 确 有 效应 , 则 当 区 组 划分 不 当时 ,会 降低 发 
现 这 种 效应 的 机 会 . 

由 此 可 见 , 不 是 在 任何 场合 下 划分 区 组 都 好 .大 没 有 足够 理由 
显示 不 同 区 组 间 确 有 显著 差异 , 则 宁肯 不 分 . 如 以 前 提 过 的 那个 比 
较 4 种 配方 ,由 5 个 人 操作 的 例子 .不 同 的 人 在 操作 技术 上 总 多 少 
会 有 差异 ,但 如 没有 根据 认为 他 们 之 间 有 颇 大 差异 , 则 分 区 组 不 一 
定 有 利 . 在 实际 工作 中 , 这 种 界限 不 易 掌 握 , 这 里 只 能 作为 一 条 一 
般 性 的 原则 谈 一 下 . 

例 $S.3 重新 考察 例 5.2, 把 “施肥 方法 ”这 个 因子 理解 为 区 
组 . 即 例 (5.2.4) 中 的 数据 ,看 作为 4 个 品种 在 3 个 村 子 里 种 植 的 
结 采 . 据 该 例 分 析 , 品 种 A 的 效应 在 a =0.05 的 水 平 上 达到 显著 
(但 在 c =0.01 的 水 平 上 则 和 否 ), 区 组 效应 达 不 到 显著 .更 有 其 者 ， 
区 组 的 MS(81.2$) 还 小 于 误差 的 MS(243.00) ,说 明 在 本 例 中 分 
区 组 没有 带 来 什么 好 处 . 

现 如 果 把 ($.24) 当 作为 一 个 完全 随机 化 试验 的 结果 , 则 

SS = 5444.75,SSa = 3824.25S( 与 以 前 相同 ) 
SS, = 162.50 + 1458 = 1620.50 
SS, 的 自由 度 为 4(3 一 1)=8, 而 MS, =1620.50/8=202.56.A 的 
下 比 为 MSa /MS。 一 6.29, 也 超过 了 FF; g(0.05)=4.07, 即 也 得 出 
A 的 效应 为 显著 的 结论 . 


6.5.5 多 因素 正 交 表 设计 及 方差 分 析 


例如 , 若 一 个 试验 中 涉及 4 个 因素 A, B,C,D ,分别 有 有 ,/， 
Pp 和 gq 个 水 平 ,在 效应 合 加 (无 交互 作用 ) 的 假定 下 ,模型 为 
Ya = + arth te +d, + ew (5.25) 
其 意义 与 (5.13) 相 似 .如 做 全 面试 验 , 即 对 
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1 委 ;过 4 委 ) 委 /1 委 2 魏 01 入 < 委 4 (5.26) 

范围 内 的 (人 jw) 都 观察 了 YY;;,,, 则 方差 分 析 与 模型 (5.13) 相 
似 . 但 是 ,这 个 作法 需要 做 kipg 次 试验 ,这 往往 太 多 了 . 如果 因素 
数目 更 多 , 则 所 需 试 验 次 数 大 得 不 现实 ， 

因此 ,在 实用 中 一 般 只 做 部 分 实施 , 即 对 (5.26) 范 围 内 的 部 分 
(jz 2) 做 试验 .问题 在 于 :这 一 部 分 不 能 随心 所 谷地 取 , 其 取 
法 必须 保持 某 种 平衡 性 ,以 达到 以 下 两 个 日 的 : 

1. 模型 (5.25) 中 的 有 关 参 数 LsQi, Di, Cus ds 等 仍 能 得 到 适 
当 的 佑 计 . 

2. 总 平方 和 SS 仍 能 进行 分 解 ,以 列 出 像 表 6.2 那样 的 方差 
分 析 表 . 

这 个 问题 如 何 解决 ,其 细节 已 远 超 出 本 课程 的 范围 .在 这 里 ， 
我 们 只 介绍 一 种 叫做 “ 正 交 表 ”" 的 工具 , 它 简便 易 用 ,在 实用 中 广 为 
流传 . 

看 下 面 这 张 表 


表 6.3 Ls(4xX2:) 正 交 表 


5 
mp 


] | 1 ] 1 ] ] 134 
2 1 2 2 2 2 220 
3 2 ] 2 2 188 
4 2 2 2 ] l 242 
3 3 1 2 1 2 208 
6 3 2 1 2 1 290 
7 4 1 2 2 * 1 338 
8 | 4 2 | ] 2 320 


这 个 表 一 共有 8 行 .5 列 .这 两 个 数字 (8,5) 有 其 意义 :8 表示 
如 用 这 个 表 安 排 试 验 , 则 必须 做 8 次 试验 ,不 能 多 也 不 能 少 .5 表 
示 最 多 能 安排 $ 个 因素 ,不 能 多 ,可 以 少 . 
L 是 正 交 表 记 号 .Lg 表示 表 有 8 行 .4x2 表示 : 表 中 有 1 列 
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( 即 第 1 列 ) 含 有 数字 1,2,3,4, 有 4 列 含 数字 1,2. 其 所 以 称 为 正 
交 表 ,是 因为 这 表 满 足以 下 两 个 条 件 : 

1. 每 列 中 含 不 同 数字 的 个 数 一 样 .例如 ,第 1 列 含 不 同 数 字 
1,2,3,4, 每 种 2 个 ,第 2 一 5 列 都 是 含 不 同 数字 1 ,2, 每 种 4 个. 

2. 任 一 列 中 同一 数字 那些 位 置 ,在 其 他 列 中 被 该 列 所 有 不 同 
数字 占据 , 且 个 数 相同 .例如 ,第 3 列 中 数字 1 占据 1,3,6,8 行 的 
位 置 ,而 在 第 1 列 中 ,这 4 个 位 置 恰 被 该 列 不 同 数字 1,2,3,4 各 二 
据 1 次 .在 第 5 列 中 ,这 4 个 位 置 则 被 该 列 不 同 数字 1,2 各 占据 2 

几 是 满足 这 两 个 条 件 的 表 就 叫做 正 交 表 . 至 于 如 何 去 构 造 出 
这 种 表 , 那 涉及 许多 深刻 的 数学 问题 .实用 上 ,把 已 造 出 的 有 实用 
价值 的 正 交 表 汇 集 起 来 附 于 种 种 统计 学 著作 中 ,实用 者 按 需 要 取 
用 即 可 . 

下 面 来 谈 谈 怎样 利用 正 交 表 Ls(4 X21) 安 排 试 验 . 这 所 讲 的 
当然 也 适用 于 一 般 的 正 交 表 . 归纳 起 来 有 以 下 几 条 : 

1. 因素 的 水 平 只 能 是 4 或 2, 为 4 的 至 多 只 能 有 一 个 ,为 2 的 
至 多 4 个 . 

2. 若 试验 要 分 区 组 (例如 在 两 台 设 备 上 做 ) , 则 区 组 大 小 只 能 
为 2 或 4. 

3. 为 确定 计 , 设 试验 中 涉及 4 种 配方 (因素 A ,水 平 4),2 种 
温度 (因素 B, 水 平 2),2 种 压力 (因素 C ,水平 2), 并 分 两 个 区 组 . 
则 配方 这 因子 A 必须 标 在 第 1 列 的 头 上 上 ,B.C 和 区 组 都 是 2 水 
于 ,可 在 2 一 5 列 中 任 选 3 列 标 上 ,还 有 一 个 空白 列 . 设 选 定 表 6.3 
的 1 一 4 列 (D 表 区 组 ), 则 设计 的 意义 如 下 :每 一 行 读 A,B.C 所 
在 的 三 列 .例如 ,第 一 行为 (1,1,1). 这 表示 第 1 号 试验 是 :A ,B,C 
都 处 在 1 水 平 .第 二 行为 (1,2,2) ,表示 第 2 号 试验 为 ;A 处 在 1 水 
平 ,B,C 都 处 在 2 水平 ,第 七 行为 (4,1,2), 表 示 A 处 在 4 水 平 ,B 
在 1 水平 ,C 在 2 水 平 ,等 等 .区 组 划分 则 看 DD 这 一 列 . 同一 数字 
属于 一 个 区 组 .在 这 里 ,D 列 的 数字 1 在 第 1,4,5,8 行 , 故 第 1,4， 
5,8 号 试验 划 在 一 个 区 组 内 , 剩 下 的 第 2,3,6,7 号 试验 划 在 一 个 
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区 组 内 . 
这 样 … 个 设计 必 能 达到 表 6.3 前 面 提出 的 两 条 要 求 .第 1 条 
很 容易 让 明 ,第 2 条 不 能 在 此 细 证 了 .考虑 (9.25) ,其 中 有 &=4,/= 
户 =d=2. 对 cipbcoycts 等 也 加 上 约束 条 件 ( 类 似 (5.15)): 
Na <0,Np -oo -0 (5.27) 
1 1 i } 
按 (5.25) 写 出 上 述 8 号 试验 的 方程 ; 
Yi = r+tartbtecrt+drt en 
Ya222 一 A++TGITTPaT+ca 二 cs 十 el 
Top = tast ortec td t+ en 
Yo = +Hart bt ct di t+ er 
Y321 = +astobrtes + dit el 
Ya2 = K+ast bt ct dy + er 
YAu2 二 p+ayrtobrt et dt+ ea 
Yo = +aatbrt+ecrtalt en 
把 这 8 个 方程 相 加 ,各 Y 之 和 记 为 >/ YY, 各。e 之 和 记 为 >，e, 则 
由 (5.27) 易 见 
SY= 8y+ >》)e 
由 此 可 知 Y = >)Y/8 为 p 的 一 个 无 偏 估计 . 
把 第 1 列 为 1 处 的 那些 Y 相 加 ,得 ( 仍 用 (5.27)) 
Yt + Yi1222 = 2U 十 2Q1 + ellll + e1222 
由 此 知 ,(Yin + Yl2w)A2 一 Y 为 ai 的 无 偏 佑 计 . 顺 此 以 往 ,对 任 
何 ai,b; ,cu，,d, 部 可 求 得 其 无 偏 估 计 . 例 如 ,要 求 c» 的 无 偏 估计 ， 
只 须 把 c 所 在 那 列 数字 2 对 应 的 试验 值 相 加 ,用 ($.27) ,得 
立 1222 十 Yt 十 了 3121 + Ya122 
= 4H + dc + e122 + e2221 + E3121 + ed4122 
于 是 得 到 ( Ypz + Y2221 + Y3pl+ Ya) 人 -YY 是 cy 的 一 个 无 仿 
估计 . 
总 之 ,在 任何 一 个 正 交 表 中 , 某 因素 水 平 i 的 效应 (例如 本 例 
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的 a; ) 的 合计 ,等 于 该 因素 水 平 i 的 所 有 观察 值 的 算术 平均 , 减 去 
全 部 观察 值 的 算术 平均 . 

接着 就 是 计算 各 因素 的 平方 和 ,例如 SSa .如 A 有 kk 个 水 平 ， 
其 各 水 平 的 效应 a; 的 估计 记 为 &1,…,&;( 其 计算 已 如 上 述 ), 又 
总 试验 次 数 为 nn, 则 

SS = n(a7 + + G7)/k (5.28) 

误差 平方 和 可 以 由 总 平方 和 SS = 六 (Y 一 了 )? 减 去 各 因素 的 平 
方 和 求 得 .其 自由 度 等 于 nw 一 1 减 去 各 因素 的 自由 度 一 一 每 一 因 
素 的 和 白 由 度 等 于 其 水 平 数 减 去 1. 

例 S.4 设 表 6.3 中 各 次 试验 的 结果 如 该 表 右 边 一 列 所 示 ， 
我 们 来 作出 上 述 计 算 . 

1. 首先 算出 全 部 试验 值 的 算术 平均 

Y= (134 + 220 + … + 320)/8 = 250 


及 总 平方 和 
SS =(134 - 250) + (220 - 2507)2 + … + (320 ~ 250Y? 
= 32832 


2. 估计 各 因素 A ,B,C 各 水 平 的 效应 及 区 组 (D) 效 应 
al=(134+220)/2-250= ~73,&;,= 一 35 


a;=29,44=79 
这 四 者 之 和 应 为 0, 这 可 以 作为 计算 是 否 有 错 的 一 个 验证 .又 
pb) = 一 18,p，= 183;c1 三 一 17,c，== 17;d， =-9,d,=09 


3. 按 公 式 (5.28) 算 出 各 效应 及 区 组 平方 和 

SS4 =8(73 + 3$ + 292 + 792)/4 = 27272 

SSp =8(18- + 18°)/2 = 2592, SSc = 2312, SS = 648 

其 自由 度 分 别 为 3,1,1,1. 误 差 平 方 和 为 
SS, = 32832 - 27272 - 2592 - 2312 - 648 = 8 

其 吕 由 度 为 (8-1)-3-1-1-1=1. 于 是 
~ MSa = SSA/ 3 = 9090.67, MSg = SSp,……, MS, = SS, 
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列 出 方差 分 析 表 : 


项 日 SS 自由 度 MS FF 比 显 着 性 
人 4 了 配方) 27272 3 9090.7 1136.33 x 。 兴 
B (温度) 2592 ] 2592 324 x 
CC 于 力 ) 2312 | 2312 289 x 
D([ 多 组 ) 648 | 648 81 

误 差 8 | 8 一 

蕊 和 32832 7 一 _ 


查 三 分 布 表 , 得 
F;.1(0.05) = 216, F] 1(0.05) = 161 
F;,1(0.01) = 540, Fi 1(0.01) = 405 
故 配 方 这 个 因素 的 效应 达到 高 度 显著 ,温度 和 压力 这 两 个 因素 则 
达到 显著 ,区 组 效应 未 达到 显著 . 
某 些 正 交 表 ( 不 是 所 有 的 ) 也 可 以 考虑 因素 间 的 交互 作用 .这 
时 , 表 头 的 安排 就 不 能 像 无 交互 作用 时 那么 自由 ,而 要 受到 某 种 规 
则 的 限制 ,具体 规则 由 一 个 与 该 正 交 表 配 套 的 “交互 作用 表 ” 给 出 . 
这 些 都 已 超出 本 书 范围 ,不 能 在 此 多 讲 了 . 


附 录 


A.(2.22) 式 的 证 明 
注意 到 两 个 行 向 量 (n 维 ) 


oO, oO. ， S. 
部 是 单位 长 (注意 (2.16) 式 ) 且 正 交 ,可 以 补充 n -2 个 行 向 量 53， 
…,b; ;使 方 阵 
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0 
Bb 一 . 
六 | 
为 正 交 方 阵 . 作 变 换 
pA ry 
| 1 
1 2 Ya 
站 
天 YY, 


则 因为 Yi,Y1,…,Y, 独立 ,各 有 方差 为 2 的 正 态 分 布 , 按 第 一 
音 的 附录 A 中 的 引 理 的 证 法 , 易 证 得 Z1,…,2Z, 也 独立 ,并 各 有 
方差 为 o7 的 正 态 分 布 . 
现 证 明 : 
E(2Z,) = 0,i 之 3 (1) 
为 此 , 记 6b; = (bn,… ,bin); 则 


E(Z;) = PECY) 一 blB + Bi(X; — X)) 


-Bo + P12 DE (XX; 一 XxX) 


因为 b; 与 b1 ,65， 都 正 交 ， 上 式 右边 两 个 和 都 为 0. 由 此 证 明了 (1) 
式 . 


另外 注意 
ZI A t+ Y)=VnY 
Vv 11 
23 ws _ XY, NX- X)Y, 
一 7 二 ] 


= 6 Be: - 又 ) Y， 
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由 于 正 交 变 换 使 平方 和 不 变 , 有 
Yf++ Y= Zi+ + 2 


B12 (X; — X)Y;+ 4 
f 二 | 7 三 3 
3 


由 于 ZL3/0,L4 0, " , Ln/o 是 独立 同 分 布 的 N(0， 1 ) 变量 ， 有 (23 
+ … 十 人)/o 一 X75.2. 于 是 证 明 了 (2.22). 


B.(2.16) 式 的 证 阴 


由 于 LC1 LDO ss, Ly 独立 , 知 La 与 > 23 独立 . 又 L> 为 有 方 


差 o2 的 正 态 分 布 而 》 12Z?/o? ~ y?_, , 故 按 分 布 的 定义 有 


7 3 (2) 


但 > Zn — 2) = > /(n 一 2) = 52 ,而 因 尺 B81= BI, 有 
— E(Z2,) 一 Bi1S. - E(B1S,) 一 (BI - Bi)S. 
故 


二 > 2 = (入 -8)MaS2) 


;=3 


02 : 
此 式 与 (2) 式 结合 , 即 证 明了 (2.26). 
习 题 


1. 在 模型 (2.6) 中 用 配方 的 方法 (不 求助 于 求 偏 导 数 ), 以 决定 最 小 二 乘 
估计 (2.12) 和 (2.13), 并 由 此 得 出 残 差 平方 和 的 表达 式 (2.23). 

2. 在 模型 (2.6) 中 ,假定 (2.5) 成 立 , 仍 记 残 差 为 51,…,6,. 证 明 以 下 各 
忆 : 
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(a) E(6.)=0,i=1,.…,n 

(b) 8,,…,6, 不 相互 独立 . 

(c) Var(6$;)= (1- T(x%-X)/S:)o 

(S17= LX-X)) 

(d) Cov(8:,0)=— (T+(X XXX)/S? ji 六 

3. 设 样本 XXX 一 No yz ,一 N(b,o ),a,b,o” 都 未 
知 , 为 要 估计 5 一 4 或 检验 假设 Ho:5 一 a=c(c 已 知 ), 可 利用 线性 回归 的 理 
论 去 做 .指出 具体 怎样 做 的 办 法 . 

4. 考虑 过 原点 的 线性 回归 模型 

Y= bX +e,i = 1 

误差 e ,…' ,e。 仍 假定 满足 条 件 (2.9). 


(a) 给 出 5 的 最 小 二 乘 估 计 B. 
(b) 给 出 残 差 平方 和 R = 183 的 表达 式 ,并 证 明 :Ra 一 1) 是 误差 广 
i 1 


差 o: 的 无 偏 估 计 . 这 与 不 一 定 过 原点 的 模型 有 何不 同 ? 为 何 有 这 个 不 同 ? 
(c) 用 附录 A 中 的 方法 ,证 明 当 误差 服从 正 态 分 布 时 ,有 R/o?2 一 y2_ 1 
(d) 给 出 回归 系数 5 的 区 间 估 计 . 

5. 考虑 回归 模型 (2.4) ,而 c1 ,co 为 已 知 常数 .假定 (2.5) 且 设 误差 服从 

正 态 分 布 , 求 cia + c2b 的 区 间 估 计 . 

6. 从 一 元 线性 回归 的 讨论 中 出 现 儿 个 有 趣 而 初等 的 数学 问题 . 现 列举 

如 下 请 读者 考虑 : 

(a) 由 第 2 题 的 (c) ,根据 方差 非 负 ,可 知 :对 任意 ”个 实数 入 ，…,X， ， 

有 

(DO = 1,…,n 

等 号 在 何 时 达到 ? 

(b) 在 6.2 节 6.2.3 段 未 尾 处 提 到 的 断言: 若 Xi,X;,，…, 是 一 串 实 数 ， 


记 Xu = (Xi+…+X)[S2= 2》)(X; 一 义 )? , 则 对 任何 固定 的 实数 < ,有 
i=1 


(4 一 义 ,)*/S: 一 0 当 noco. 这 个 事实 的 统计 意义 已 在 6.2 节 (6.2.3) 段 中 说 
明 过 了 
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(c) 我 们 已 证 明 : 在 模型 (2.6) 及 假定 (2.5) 之 下 , Var(B1) = co2/S2,S? 
-OK - 丰 . 当 然 ,方差 愈 小 鳃 好 . 故 如 限制 试验 点 X 只 能 取 在 某 有 限 


区 间 [A,Bj 内 ,就 有 一 个 如 何 配置 这 些 点 ,以 使 S 达到 最 大 的 问题 .证 明 这 
问题 的 解 是 : 知 nn 为 偶数 27m, 则 取 Xi,X 中 有 m 个 A 及 mn 个 B; 荐 n 
为 奇数 2m+ 1, 则 取 针 ),…,X; 中 有 zm 个 A( 或 B),m+1 个 B( 或 A). 不 
过 ,在 实用 上 ,这 个 设计 并 不 一 定 被 采用 ,除非 我 们 对 回归 函数 为 线性 函数 这 
一 点 绝 无 疑 义 .因为 ,这 个 设计 只 采用 两 个 自 变量 值 , 它 无 法 借助 于 观察 数据 
去 发 现 真 实 的 回归 函数 与 线性 函数 的 可 能 的 偏差 . 

7. 证 明 6.3 节 6.3.1 段 末尾 处 多 元 回归 系数 最 小 二 乘 估 计 的 三 个 性 
质 . 

8. 设 (XiYi)，…(Xz) 是 从 二 维 正 态 总 体 N(a,o,oi,cs,o) 中 抽 
出 的 样本 ,以 ~ 记 样 本 相关 系数 .用 以 下 的 思路 证 明 当 p=0 时 , Vn-2r/ 
V 1 一 户 一 t, -2: 固 定 X1,…,X, ,考虑 Y1,…, Y, 的 条 件 分 布 ,因为 p=0 表 
不 Xi, 独立 , 故 Y|,…, 站 , 的 条 件 分 布 即 是 其 无 条 件 分 布 , 即 YY ,…, 了 
独立 ,有 公共 分 布 N(5 ,co3) .这 可 写 为 回归 模型 . 

Y=b+BX,+e,io 1,%,n (1) 
回归 系数 fi =0,e; 一 N(0,o*),o*= 6o5. 然 后 在 这 个 模型 中 使 用 (2.26)( 记 住 
Bi 二 0). 证 明 (2.26) 式 左边 正好 就 是 Vn 一 2r/v 1 一 .这 样 就 证 明了 在 给 
定义 1,…,X; 的 条 件 下 ,Vn 一 2r/V 1 一 户 的 条 件 分 布 总 是 1 ;与 X,,…， 
X, 无 关 . 因此 Vn 一 2r/V TI-r2 的 无 条 件 分 布 就 是 上 ，_， 其 所 以 要 在 给 定 
入 1，…,X; 的 条 件 下 来 考虑 ,是 因为 线性 模型 (1) 有 关 的 理论 ,特别 是 (2.26) 
式 ,都 是 在 X; 为 常数 的 情况 下 给 出 的 . 

9 考虑 下 面 的 统计 模型 :样本 Xi ,Xi 了,… ,YY 独立, XX 一 NN(d; 
ta,o), YN(dit+6,0) ,i 二 1,…,n. 这 里 d1,…,d, 和 a,b,o? 都 末 知 !， 
要 检验 假设 Ho:a =P. 

(a) 试 通 过 使 用 2Z; = YY; 一, ,i 二 1,…,n, 用 1 检验 来 处 理 这 个 问题 . 

(b) 说 明 :这 个 模型 事实 上 是 一 个 随机 区 组 试验 模型 ,共有 了 个 区 组 ,区 
组 大 小 为 2. 写 出 化 到 这 样 一 种 模型 的 过 程 . 

4c) 用 随机 区 组 模型 的 玉 检验 来 处 理 所 的 检验 问题 ,证 明 它 与 用 (a) 中 
的 方法 得 到 的 一 致 . z 
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10. 验证 一 下 ,下 面 的 表 是 正 交 表 ， 


] 
2 
3 
4 
3 
6 
7 


to 
一 -i 
DD 一 DD - ~ 
TO Fa ro 一 一 
_ TD 一 
kt 天 ph mh to 一 


fo 一 


按 正 交 表 命 名 法 ,这 个 表 的 名 称 应 是 什么 ” 它 在 用 来 安排 试验 时 受到 哪 
些 限制 ? 现 如 有 三 个 两 水 平 因 子 A,B,C, 共 做 8 次 试验 ,并 分 两 个 区 组 做 ， 
这 试验 如 何 用 这 张 表 安排 ? 写 出 其 方差 分 析 表 . 
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习题 提示 与 解答 


第 一 章 


3.B. 

4. 一 种 可 能 的 表 法 是 

Al t+A,=A1t(A;—A1)+[A;-(Ai+ A,)] 

+ +[A, (Alt+…+.…A,_1)] 
5. 先 把 A + B+C 表 为 互 斥 事件 和 
A+B+C=A+(B-AB)+(C-AC- ABC) 

再 证 明 P(B- AB)=P(B)- P(AB),P(C- AC- 4BC)= 
P(C)- P(AC) ~ P(ABC),R 及 P(ABC)= P(BC)- P(ABC), 
整理 即 得 . 

6. 充 要 条 件 是 P(A),P(B) 中 至 少 有 一 个 为 0. 

7. 不 一 定 . 成 立 的 充 要 条 件 是 P(B- A)=0. 

8. 反复 利用 以 下 两 个 重要 公式 


AlA2…A, = 2 A, Al+ A;,+* + A, = [| A, 
i-1 


(这 两 公式 请 自 证 一 下 ) 
9. 考虑 一 个 盒子 内 含有 三 个 球 ,其 上 分 别 标 有 数字 1,2,3. 现 
从 中 随机 抽出 一 个 ,记事 件 
A=| 抽 出 1 或 2 球 |,B= 1 抽出 2 球 ! ,C= | 抽出 2 或 3 球 | 
10. 第 一 问 :直接 计算 P(C(A +B))= P(CA)+P(CB). 第 
二 问 : 仍 算 PCC(A+B)), 但 把 A+B 表 为 A+B=(A--B)+ 
AB +(B 一 A). 设 法 去 证 明 
P(C(A ~ B)) = P(C)P(A - B) 
P(C(B-A))= P(C)P(B -~ A) 
前 一 式 可 由 P(CA)=P(C)P(A),P(C:'AB)=P(C)P(AB) 两 
边 相 减 得 到 , 因 CA -CAB=C(A-AB)=C(A~8B), 及 P(A- 
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B)=P(A)— P(AB). 
11. 例 : 一 盒 中 有 人 2 个 球 , 分 别 标 有 数字 1,2,…,12. 现 从 其 
中 随机 抽出 一 个 ,定义 事件 
A = ;抽出 1,2,3 号 球 之 一 1,B = | 抽出 2,3,4 号 球 之 一 | 
= {抽出 2,3,5,6,7,8,9,10 号 球 之 一 |. 
12. 前 一 部 分 的 证 明 与 第 10 题 的 第 二 问 类 似 , 反 例 可 用 11 
题 的 例子 . 
13.A=Ai(As+ A;3)(AsAs+ AsA6+ A4A6) 用 乘法 定理 ， 
注意 
P(444:+ 44 + AsAo) =P(AsA;sA6)+ P(AIA,A.,) 
+P(AsAsAc)+ P(AsA ,Ac) 
逐 项 用 乘法 定理 ,答案 :320/729=0.439. 
14. 反例 :一 盒 中 有 5 个 球 ,分 别 标 上 数字 1,2,…,5. 现 从 中 
随机 抽出 一 个 ,定义 事件 
= {抽出 1 或 2 球 |,B = {抽出 2 或 3 球 }， 
= {抽出 1 或 3 球 | 


16. 需要 证 明 

P(B; B; BB; ) 一 P(B; )P(B; )*…P(B; ) (1) 
对 任何 满足 条 件 2 二 7 二 的 7 及 1 之 记过 …< 之 记 才 nn. 以 上 记 
B;,…, Bi 中 Bi 二 A; 的 j; 的 个 数 .对 实行 归纳 法 .车 k=0, 则 由 
独立 性 定义 知 (1) 式 对 , 现 设 k=m 时 (1) 式 对 .来 证 明 当 有 = zz 十 
1 时 (1) 式 也 对 . B; ,…, B; 中 有 m+1 个 有 “bar” 的 .为 方便 计生 不 
失 普 遍 性 ,不 妨 设 B, = 元， .有 

B; B;…B; = 局 Bi BB; + A; Bi B; 
右边 两 事件 互 斥 , 故 

P(B;*…B; ) 一 P(B;*…B; ) P(A; B;*…B; ) (2) 
因为 在 B; ,…,B; 中 只 有 ni 个 加 bar 的 ,A; ,3 中 也 只 
有 nn 个 加 “bar 的 . 故 由 归纳 假设 , 知 
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P(B,*…B; ) = P(B;,)- ‘P(B; )， 
P(A; Bi*…B; ) = P(A; )P(B;)…P(B;) 
以 此 代 和 人 (2) 式 ,并 注意 1- P(A; )= P(A )=P(B; ), 得 
P(Bi Bi ) = P(B; )…P(Bi; ) 
于 是 完成 了 归纳 证 明 . 
17. 总 排列 数 为 4! = 24. 分 别 计算 放 对 1,2,4 封 的 排列 数 为 
8,6 和 1. 答案 :9/ 24= 3/8. 
18. 用 全 概率 公式 ,对 两 而 言 , 分 四 种 情况 :4A; = { 甲 抽 中 , 乙 
抽 中 | ,A;,={ 甲 中 乙 不 中 | ,A;= { 甲 不 中 乙 中 |,Asy= {甲乙 都 不 
中 | .答案 :2/10,17/55,41A110. 以 再 抽 中 的 可 能 性 最 大 . 
19.(7 Do UN = De (pl)" /np)! 
20. 再 继续 赌 四 局 ,排出 一 切 可 能 情况 ,答案 为 11:5. 
21. 答案 为 307 91. 其 所 以 不 同 ,原因 在 于 ,仔细 一 想 可 知 : 知 
道 某 特定 角子 出 么 , 比 知 道 至 少 出 一 个 么 ,要 更 有 利于 多 出 么 , 因 
而 更 不 利于 得 出 大 的 和 数 . 
z 22. 由 对 称 性 考虑 ,可 让 选 定 的 一 男孩 固定 一 个 位 置 . 剩 下 的 
1 二 7 一 1 个 小 孩 归结 到 直线 排列 的 情况 . 
23. 第 一 个 事件 的 对 立 事件 为 “每 方 各 有 一 张 A”. 其 概率 为 


1 5/ 后 一 事件 比较 复杂 ,要 分 解 为 一 些 互 帮 事件 之 
和 ，, 即 如 


:东方 24 ,西南 各 1A 等 ,共有 4x3=12 种; 
| 东 , 西 方 各 2A 1 等 ,共有 6 种. 


> py (4) 48! 52! or 
一 事件 概率 为 41 | ”二 3757/ 7 ,后 一 事件 的 概率 


4 /4Y 48! | 521 

为 [| 国 T3153/ 如 ji' 答 案 :0.719135654. 

24. 最 简单 的 做 法 如 下 :从 对 称 考虑 出 发 ,不 妨 把 甲 取 的 点 定 

在 图 1 中 的 A 点 处 .这 时 ,为 了 使 题 中 所 说 的 事件 发 生 , 乙 所 选 的 
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点 必须 在 图 1 中 的 BAC 弧 内 , 且 一 BO4 和 人 COA 都 是 120 . 故 


概率 为 2/3. 
25. 做 法 大 体 上 类 似 例 2.5. 答 案 为 


放 8! 8 
17131 “ 21213111/ 7 一 01224 
27.(a) 所 求 概率 为 (1 - p1)…(1 一 


六 ). 利 用 1- 了 <e < 当 z>0.(b) 所 求 
概率 不 超过 >， zf…ppx，>， 求 和 的 
范围 为 1 迄 和 < 长 赤 和 过 有 但 在 ( 户 | 二 
图 1 … 十 p,)* 的 展开 式 中 ,每 一 个 这 样 的 项 
都 出 现 R1 次 . 
28. 不 可 以 那样 算 ,理由 与 21 题 同 . 
30. 甲 胜 概率 为 (用 全 概率 公式 ) 


1 
?= 人 
不 难 证 明 训 <172. 因 为 


1 LS 1 1 lvl1 
P= 4 “了 to 0 < 3 " 4 27 
1 1 1 
= 3 十 4° 4 < 1/2 
因此 这 规则 对 甲 不 利 .(p 的 确 值 为 2log2 - 工 , 试 证 明之 . ) 
第 二 章 


maa (0)- (eo 
节 ) 
2. 先 用 全 概率 公式 得 出 p, 的 逆 推 公式 
记 = pll- p11)+(l -pp)p,i 
此 式 推导 如 下 : 若 第 一 次 试验 A 发 生 ( 概 率 为 p), 则 剩 下 n 一 1 次 
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试验 应 出 奇数 个 A ,概率 等 于 1 一 记 -1. 丰 第 一 次 试验 中 A 不 发 
生 ( 概 率 为 1 一 pp), 则 剩 下 n 一 1 次 试验 应 出 偶数 个 A ,概率 等 于 


pr-1: 义 当 n=1 时 pr=p1=1-p, 而 3[1+ (1 -2p)"j] 当 n=1 
时 也 为 1-p. 故 当 n=1 时 正确 . 设 当 nn 一 1 时 正确 , 则 p, -1= 
二 [1+(1-2p)” 1 以 此 代入 上 式 , 即 得 p= 二 [1+ (1 
2p)"]. 故 当 n 时 亦 正确 . 


7 a /ny 2 
3. 答案 为 | ] /2 用 公式 > 人 = | .此 式 可 由 第 一 
! 7 


章 (2.5) 式 中 邻 j= 二 上 = 1 ,并 注意 [ 小 J 
4. 赠 博 至 多 在 2a 一 1 局 结束 ,让 二 人 赌 2a -1 局 , 则 只 


胜 a 局 或 更 多 则 甲 胜 , 否 则 甲 败 ， 改 四 胜 的 概率 为 2b(i32 2a—1, 


p). 当 p=1/2 时 ,由 6b(i;2a 一 1 1/2) = 524 1 i. ;2a 一 ]， 
172) 即 知 上 式 为 172. 另 外 由 二 人 赌 技 相 同 ( = 1/2) ,及 胜 负 
规则 对 二 人 是 公平 的 , 知 二 人 有 相同 的 获胜 概率 , 即 17 2. 

5. 考察 比值 


blk;n,p) k+l11-p 
bl(k+t1l;n,p) nn-k p 


如 果 p 委 (n+1) 司 , 则 此 比值 总 大 1. 若 p 宇 n/n+1), 则 总 过 1. 
铬 (n+1) <p<<n/An+1), 则 当 & 小 时 大 于 1, 从 某 个 开始 
则 委 1. 其 转折 处 即 达到 最 大 之 .为 [(n +1)p]([a] 表 不 超过 a 
的 最 大 整数 ), 当 (7 二 1)p 不 为 整数 ;为 (n+1)p 及 (7 +1)p—1 
(在 这 两 个 值 处 同时 达到 最 大 ), 如 (nn +1)p 为 整数 . 

6. 以 pij 记 恰 有 第 i,; 盒 不 空 ,其 余 都 空 " 的 概率 . 先 证 明 所 


12 
可 1 10 工 10 
pu = 加 -2 
“全 在 1,2 盒 内 "的 概率 “全 在 1 盒 内 ”的 概率 =“ 全 在 2 盒 内 ”的 
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概率 ). 

7.(a) 大 了 ,X 取 大 值 的 概率 上 升 而 取 小 值 的 概率 下 降 . 故 
IX 过 的 概率 当 p 上 升 时 只 能 下 降 . (b) 考 察 一 个 试验 ,有 三 个 
可 能 的 结果 : A1, A,,A;, 其 概率 分 别 为 p1, p32 一 pl 和 1 pz, 记 
A=AI+A， .以 X 记 ?2 次 试验 中 A; 发 生 的 次 数 , =1,2, 则 XI 一 
Bln,pi1), Xi+ X;~ Bln, py). 疏 


类 
P(X| kk)= 2 6(isn,p1), 


P(X + X, 之 k)= Si n ， 旋 ) ) 
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因为 当 XI+ X2 委 & 时 必 有 XI 和, 故 POCOXI+X RN) 过 POCOXI 势 
&) , 即 当 p< 之 p;, 时 有 
ss 


Boisn, pa) < Polisnsp) 
(c) 写 出 /(p) = > jz (1 一 p)”'. 逐 项 求 导 数 .注意 
ia pei 
= ("jel -Pp)” ~ (nn-i): | ja 一 四 ) 
令 ;=0,1,…, 淮 相 加 , A jr" 


证 明 它 与 2 让 | 。 (1 - Dr 和 dt 的 导数 同 . 又 当 
= 1 村 此 积分 为 0, 而 P(X 有 有 ) 也 为 0( 因 过 nn). 故 二 者 必 相 
等 ). 

8. 由 于 B(2,p) 有 三 个 可 能 值 0,1,2, 而 Xi,X, 独立 同 分 
布 , 故 X1,X; 必 都 只 有 2 个 可 能 值 (否则 Xi + X, 的 取 值 个 数 可 
能 会 小 于 3 或 大 于 3. 这 两 个 可 能 值 必 为 0,1. 因为 , 设 可 能 值 为 
a,b,a<b, 则 24a=0,26=2,a+b 二 1. 记 pi= P(XI=1),p;,= 
P(X,=1) 则 
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pb 一 PXI+X =2)= PXI=1)POX: = 1)= pip2 

故 p?7= pips 仿 上 推理 ,有 

p* = pip2,(l— p) = (1- p1)(1 ~ p;) 

2p(1 = p)= pi(l ~ p22) + (1 pi)p; 
由 此 三 式 , 不 难 解 出 pj 二 p= p. 

10.(a) 设 1X3,XX1, 义 ; 独立 ， 分 别 服从 波 蛙 松 分 布 P(A1) 

和 P(A 一 A1), 则 Xi+ XX 服从 波 哇 松 分 布 P(X43). 青 由 P(X| 志 
k) 宇 P(X1+ Xs 全 ) 即 推出 所 要 的 结果 .(b) 写 出 P(X 委 &) = 
Saiyil, 证 明 其 导数 等 于 一 e “XX/k&1. 鼓 本 | Wea 一 


ye /il 为 一 常数 C( 与 4 无关). 但 当 A 一 0 时 , 它 趋 于 0, 故 
i=0 
C= 0. 

11. 与 第 5 题 相 似 , 考 察 比 Palk)/patk+1). 

12. 直接 计算 : P(E)=b(n;yN,p)(p =pi(l1 -py)+(1- 


pI) po) P(EIE) = pT 07 Nb -py))*((1-— 


pO)p2)” “(Cp)N "(p =pipy+ (1 pi)(1- ps), 是 (A,B)+ 
(A ,B ) 发 生 的 概率 ). 再 算出 P(EsjE1)= P(E1E;)/P(El) 即 
得 (注意 p + p”=1). 直 接 方 法 :注意 P((A,B)|(A,B)+(A， 
B))=p. 放 在 E| 发 生 的 条 件 下 , (A ,B ) 出 现 的 次 数 X 的 条 件 分 
布 ,就 是 B(n,p). 

13. 把 负 二 项 概率 (1.11) 记 为 4 (i;r,p). 所 要 证 的 结果 当 玉 
=1 时 对 . 设 当 -=&-T1 时 对 , 则 XI+…+X 1 服从 分 布 5 (i; 
一 1,p) 把 XX 十 … 十 义 : 表 为 Y+ Xi,Y= Xi 十 … 十 XX |. 按 上 
述 归 纳 假设 ,及 Y 与 X, 独立 ,有 

P(XI+*** + X= i)= DP(Y = P(X,=i-)) 


7=! 


= DdCGjik -1,p) pl 一方 ) 


j=0 
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为 要 证 此 式 为 4(i,k,p), 只 须 证 组 合 等 式 
J "= (| 
:二 广 一 了 rl 
但 此 式 已 在 第 一 章 例 2.4 中 证 过 ,那里 写 为 形式 
> 一 1] 十 "|= |" 十 ”| 
r 一 0 六 7 
令 -1=7 -2,r=j 吉 =i 并 注意 (” =- 
-直观 上 很 容易 解释 ,以 = 2 为 
Sr 例 ,如 图 2,. 表 示人 不 发 生 而 x 表 示 
人 4 发 生 . 在 A 发生 第 2 次 时 ,的 个 数 
图 2 为 XI+X:. 由 于 各 次 试验 独立 ,Xi1， 
X; 必 独 立 且 都 服从 几何 分 布 . 


广 一 


| 
”zr(1-p)'. 因 为 


p=( op) ,p= ( 
有 人 ]>( mio) 故 总 有 pi > p>. 理由 很 简 


单 :计算 psy 时 多 了 一 个 限制 :最 后 一 次 试验 A 必 出 现 ,而 算 p 
时 ,并 无 这 个 限制 . 
15. 用 全 概率 公式 易 得 


Pp(Y = &)= P(X = n)b(k;n,p) 


nl (1 — p)” 


_ a > k e afTA(C1L-- p ) ] 天 
! 人 (nk)! 
而 式 中 的 和 等 于 e212 
16. 计算 P(X+ Yu). 用 全 概率 公式 ,并 以 下 记 久 的 分 布 
商 数 ,有 
PIX+ Yu)= Pl(Y = a)P(X+ dl ) 
” .308 ， 


+ Pl(Y = a;)*: P(X+ a 人) 
= pF(u — al)+ pF(u ~ a2) 
对 4 求 导数 即 得 ,推广 到 多 于 两 个 值 的 情况 显然 . 
结果 为 | fw,z /ww)w tdi 
18. 当 a; 中 有 为 0 的 时 ,不 妨 设 ci=0. 这 时 
P(XY =0)>P(Y =0)=p1>0 
故 XY 不 能 有 密度 函数 (否则 应 用 P(XY =0)=0). 如 a; 都 不 为 
0, 则 仿 16 题 做 ,只 须 注 意 
» |F(u/ai), a; >0 
PlaiX Su) = 11 ~ Fl(u/a),a; <0 
玉 为 X 的 分 布 函数 ,二 者 对 也 的 导数 者 是 [二 几 攻 让 
19. 记 F(zX)=P(Yr). 当 XO0 时 ,F(x)=0. 帮 x>0, 则 
上 二 了 = llogY < logxr! 
= {(logY - a)/o < (logr -aua)vc 
友 F(x)= 二 @((logzr 一 4a)/o). 对 工 求 导 得 f(z). 
21. 记 F(xz)= P(Y 达 XT), 则 FF(r)=0 当 zx 人-1,=1 当 
Xz 之 1. 大 |x|<1, 则 在 基本 周期 [0.2x) 内 ,事件 {Y 志 x | 等 于 | arc- 
cos TT 夺 久 人 2x 一 arccos ,其 中 arccos 工 在 (0,r) 内 ，, 故 


[1 立 妇 了 = » [2ri + arccos xX 人 XT2Irn(i + 1) -arccos x | 
于 是 | 
F(x) = ~、 ,D2r(i + 1) + arccos +) 一 更 (2ri ~ arccos x )] 
逐 项 对 x 求 导 ， 即 得 f(x ). 
22. 注意 {Y 之 x! = 和 1X; 过 zf. 于 是 得 了 的 分 布 函数 为 


所 (xz). 对 Z, 注 意 i 宇 x! = | 全 于 是 P(Z 去 >) = 
is 


1--PZDzr)=1-(L-FGz))7. 对 工 求 导 得 密度 图 数 . 

23. 直接 证 明 , 只 须 注 意 本 题 F(x)= 二 +/A9(0 达 x+ 碌 0), 而 
f(z)=1/9(0 达 XxX 亿 9), 其 外 为 0). 直观 看 法 :0 一 max(XI，…， 
X,) 为 Xi,X， 的 最 右 点 与 边界 6 的 距离 .而 min( XI XX,) 
是 Xi,…,X, 的 最 左 点 与 边界 0 的 距离 . 二 者 性 质 一 样 只 是 看 的 
方 同 不 同 . 由 于 均匀 分 布 对 区 间 内 各 处 
一 视 同 仁 , 这 两 个 距离 的 概率 分 布 应 当 

24. 考察 事件 |Y| 达 ,YY 之 wv. 看 
图 3,OA 为 第 一 象限 分 角 线 ,A 点 的 坐 
标 为 (a,u),OB 和 OF 之 长 都 为 ,而 
OBCA 和 OFEDA 都 是 平行 四 边 形 , 稍 加 

3 思考 即 不 难 发 现 . 

(人 轨 委 zx 站 =| (XI,X2) 落 在 上 述 两 个 平行 四 边 形 内 上 


故 
Pi 有 委 wo 二 = | e "1! dzxidx; 


+ | endege, 


OFEDA 
由 对 称 性 ,这 两 积分 之 值 同 , 用 累积 分 法 算 第 一 个 积分 ( 先 固 定 x， 
对 zx, 积 ) ,不 难得 出 上 述 两 积分 之 和 为 (1 一 e-**)(1-e *). 由 此 
证 明了 题 中 的 所 有 结论 . 

25. 用 归纳 法 , 先 肯定 : 当 n=0 时, 不论 T>0 取 什 么 值 ， 
P(X=0)=e “成立 .这 很 明显 ,因为 X=0 意味 着 最 初 那个 元 件 
的 寿命 之 了, 其 概率 | Ae dt = e- 7 

现 假定 公式 P(X=n) =e MT(AT)"/n! 对 4 二 有 一 1 成 立 ， 
而 计算 P(X=&). 以 zi 记 第 一 次 替换 发 生 的 时 刻 , 则 在 给 定 X， 
的 条 件 下 ,在 时 段 (XI, 丁 ) 内 要 发 生 上 一 1 替换 .这 时 有 段 之 长 为 
工 一 xi. 按 归纳 假设 ,在 这 段 时 间 内 恰好 替换 一 1 次 的 概率 ,为 
370 。 


-AT-XD(ACGT 一 x1))* i/A(k 一 1)! 由 于 Xi 只 能 在 (0, 丁 ) 内 且 
其 概率 窗 度 为 Ae “"1, 故 
P(X =k)= [ewe Tada(T — ri idzri/(k— 1)! 


易 见 此 积分 为 e-*T(AT)*/&1, 于 是 证 明了 公式 当 n= 时 成 立 ， 
而 完成 了 归纳 证 明 . 

27. 用 公式 (4.10) 算 出 (X+oY,X-pY) 的 联合 密度 g(u， 
站) .再 决定 ,使 这 联合 密度 可 拆 成 两 个 图 数 gj (uD) 和 gy(wv) 之 
只 ,答案 :=clvo .此 题 有 其 他 简单 方法 , 见 第 三 章 习 题 . 

29. 设 Xi Xe YY 独立 同 分 布 ,各 服从 标准 正 态 
分 布 N(0,1). 记 


大 2 
2) Y?, 2,= > /和 Y? 
1 i—1 : i=1 


出 2Z] ~ 所 ;,23 一 Fi,,Z2 宇 Z3. 今 有 
P(2 之 Ra)) = 

故 有 :P(Z; 宇 kFi,,(a)) 二 a, 男 一 方面 ,又 有 
P(ZI 宇 Fi,,(a))= a 

由 这 两 式 , 及 2Z, 之 Z1, 即 得 RE , (a) 宇 FI ,(a). 


30. 易 见 | ， :_ zydzdy = 0. 故 为 证 明 g 是 密度 函数 ,只 


须 证明 它 非 负 .但 1 xy | 在 x?+y? 之 1 内 的 最 大 值 小 于 1, 而 f(x， 
y) 在 x*+ yy 过 1 内 的 最 小 值 为 e1/2x > 17100. 故 知 g 非 负 . 


一 结论 易 证 ,因为 对 任何 a > 0 有 | Zzdz = 0. 


第 三 章 


1. 不 直接 利用 对 数 正 态 分 布 密度 算 较 方便 . 按 定义 , 若 X 为 
对 数 正 态 分 布 , 则 X=e*,Y~N (a,o). 于 是 可 利用 公式 
(1.18). 这 涉及 计算 形 如 
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22 四 2 了 
| ele te) /5 dz 
-oc 


的 积分 .把 bx 一 (x 一 a 人 207 写 为 (x 一 c)?/2o*+d 的 形式 ,其 
中 <=ewa+pc, 即 不 难 算出 上 述 积分 . 

2. 易 抑 它 只 与 区 间 之 长 5 一 a 有关 (何故 ). 记 6= (ba) 人 /2， 
可 就 R( 一 9,9) 的 情况 算 ,结果 为 9 -3= 一 6/5. 

3. 设 X 服从 超 几 何 分布 ( 第 二 章 例 1.4), 可 把 X 表 为 XI 二 
… 十 义 , ,这 是 设想 个 产品 一 件 一 件 抽出 , X;=0 或 1 视 第 ;个 
产品 为 合格 品 或 否 而 定 , 先 证 明 

P(X;=1)=M/N,P(X;=0)=1— M/N,i=1,…,n 

P(X;=1,X,=1)=M(M-1)/AN(N-1) 

P(X; =1,X,=0)= P(X,=0,X,=1) 

=M(N—-M)/N(N-1) 
P(X;=0,X;,=0)=(N-~-M)(N— M-1)/N(N-1) 
当 i 关 j. 由 此 就 不 难 算出 (X)= MAN 及 E(W) 把 X= 


2 鲁 : , NnM _ 
(Xi1+… 十 XX,)” 展开 ), 从 而 算出 Var(X) = N—4N 1 A j". 
4. 在 不 放 回 时 ,2 种 情况 (用 1 把 ,2 把 ,…,nn 把 ) 都 是 等 可 


能 , 即 P(X=7)=1/n,i= 二 1,…,n., 故 


E(X) = 一 >; = Lt 四 2 
i=1 


如 有 放 回 , 则 X = 概率 为 六 是 1]2 的 几何 分 布 变量 再 加 上 1. 按 
例 1.2 得 BE(z)=1+ t=1tn l=n 
5. 作法 与 第 3 题 相 似 (实际 上 ,第 3 题 为 本 题 当 w =0 或 1 时 

的 特例 ). 但 此 处 X 的 分 布 为 

P(X; = a) = 1/N,j =1 Ni 1 
当天 ) 时 ,(X;,X;) 联 合 分 布 为 

P(X; = a,,X; = a) = 1/AN(N -1)(u 天 了 (2) 
由 此 易 算 出 下 (X)=a .为 算 Var(X ), 要 算 开 (XiI+…+X 7) 有 
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E(X?:) = VS a3/N .而 由 (2) 有 


二 


F(XX;)= NEN DA 


1 i 7 SN 3 
一 : NOCON 一 DL (ne) 一 > oa 
再 经 过 简单 的 整理 ,可 得 


Var(X)= NE 


6. 分 析 X 的 构成 , 它 等 于 XI+…+X ,其 中 X 是 已 登记 了 
i 一 1 个 不 同 数 字 的 情况 下 ,再 抽 到 一 个 未 登记 的 数字 所 需要 抽 的 


次 数 ,显然 ,Xi = 1, 对 i > 1,X; = 一 个 概率 p 为 1 二 的 几 
何 分 布 变量 加 上 1. 由 此 用 例 1.2 算 出 E(X,)= n/m-72+1)( 此 
式 对 i 站 二 1 也 对 ), 故 E(X) = Da/ -7+1). 


7.(a) 用 全 概率 公式 算 总 (Cr+1,2): 先 把 > 个 球 随 机 放 人 了 7 

盒 .如 恰 有 & 个 空 盒 ( 概 率 为 py(r,n)), 则 剩 下 一 球 必 须 落 在 已 
有 球 的 盒子 (其 n 一 上 上 个) 中 ,其 概率 为 (7 一)/An; 或 者 恰 有 有 + 1 
个 空 盒 (概率 为 p41(7 ,7 )), 则 剩 下 一 球 必须 落 在 无 球 的 盒子 
里 ,其 概率 为 (k++1)/n. 由 此 得 题 中 之 (1 ) 式 . 

(b) 把 题 中 的 (1) 式 两 边 乘 以 有 ,再 对 ==0,1,…,n 一 1, 相 加 ， 
在 化 简 右 边 时 注意 . 


] 一 


-1 
Skperi(r,n)(k + 1) 


一 | 
= Dk+1) palr,n) 


天下 
2 

— Dk+1)per(r,n) 
k=0 
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= DRpilr,n) 一 > (7 
g=1 k=|1 
nl nn ] 

= Djkpilrsn) — SY pplr,n) 


k=-0 类 一作 


这 样 即 得 出 右边 之 和 为 | -jw 110 三 2 电 然 ,因为 ,不 投球 时 


8. 要 年 出 C, 使 c| (1 + x ) "dr = i. 令 N=2xn-1,F 


式 化 为 c| a tr) D2dr = 二 1. 邻 z = y/VN. 上 式 化 为 


CC 六 vy +1)22 
RR 人 tN 


一 《SS 
) dy = 1. 与 自由 度 为 N 的 1 分 布 密 度 比 
N+ 


Vv 


-rE 
CO 
此 密度 关于 0 对称 , 故 其 均值 为 0, 方差 为 C| 2(1 + za)-vda 


= 2C| 2(1+ z2) dz. 这 个 积分 经 变数 代 的， = 1 za。 


= V (1 一 Zz)/t) 可 化 为 8 积分 . 
9. 由 第 二 章 22 题 可 知 Yj 的 密度 函数 为 2G@(4z)op(z), 这 里 
和 ,92 分 别 是 N(0,1) 的 分 布 和 密度 函数 , 故 


E(Y)= ?| ze(z)p(z)dx 
=2| zez(z)[| p(w)dy Jax 


= 起 rp(r)p(y)drdy 


1 | 和 
一 ”一 一 +ty 2 
二 元 儿 ， aze dzdy 


积分 区 域 在 图 4 中 直线 / 的 下 方 , 化 成 极 坐 标 后 二 
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下 2 ， 2 /和 
| xe ry)dzdy = | cos@d0 
wr Iyer 一 3 元 /4 


| re "2dr =v2.(v2r /2) = Vr 
.0 


因而 得 FE(OYi)=1Mr. 由 于 Yi+Y=XXI 
+ X,, 和 ME(Y)= —E(Y)= -1AMax. 
10. 卡 方 分 布 的 方差 为 其 均值 的 2 倍 ， 
故 若 X， 和 X。 分 别 服从 卡 方 分 布 x%， 和 4 
X22, 则 因 Xi ,X2 独立 ,将 有 
E(X; + bX;) = m + bn,Var(X1 + bX;) = 2m + 26°*n 
要 后 一 值 为 前 者 的 2 倍 ,只 有 在 565=0 或 1 时 才 行 . 
11. 化 为 极 坐标 , 则 Z 与 > 无 关 而 只 是 9 的 晒 数 ,再 利用 第 二 
章 例 3.6 中 得 出 的 9~R(0,27). 


12. 先 设 F 有 密度 记 则 F(z) = | 7(y)dy( 因 X 只 取 非 负 
值 , f(y) = 0, 当 yy << 0). 故 


[1 F(z)ldr = 六 由 mo - 六 ray]az 


-| 7onaarz = 六 由 are 


-| (dy = E(X) 
若 P(X = 有)= posk = 0,1,2,…, 则 当 71<x<i+1l 时 .有 


F(x) = P(XZz) = P(X=0,1,,i) = Pp. 故 1- F(zx) 


oO 


Fa roer = SF = SH, 


= (pit pt)+ (p+ pt ee) +t (p3t en) +t 
= pit+2°. pt+3°p3t+. = E(X) 
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13. 证 明 要 用 到 重要 的 施 才 次 不 等 式 
E(X*)E(Y)> (EC(XY)) (3) 
此 实际 上 在 定理 3.1 的 关中 已 证 明了 :只 须 把 (3.3) 式 中 的 入 1， 
12 改 为 0, 则 (3.4) 式 即 成 为 此 处 的 (3) 式 .等 号 成 立 的 条 件 为 X， 
Y 有 线性 关系 , 即 存在 常数 c ,使 了 =cxX 或 X=cY. 


现 把 (3) 式 用 于 X=V X,Y = 1 WW, 即 得 EX-) 
EC 等 号 当 且 仅 当 有 常数 ,使 VX = cA/ W, 即 XX;= 常数 


现 因 Xj,X; 独立 知 X1,1/X> 独立 , 故 

E(X,/X») = 下 (XI)E(ULLX ) 之 开 (XDAECOX) = 1 
(因为 (Xi)=E(X;)) 等 号 只 在 义 ),X; 箔 只 取 一 个 常数 c 为 值 
时 成 立 . 

14. 令 六 ;=X,A(Xj+ Xp2. 则 因 X…,X 
独立 同 分 布 , 易 知 Yi,…, YY, 辣 分 布 (不 独立 ). 故 EE(YI)= 
E(Y)=:…=E(Y,). 但 Yt+…+ =]1, 故 E(Y,)=1/n. 

15. 把 次 数 X 记 为 XI+…+X ,XX, 二 1 或 0, 视 第 7 次 试验 
中 A 发生 与 天 而 年 . 则 对 两 串 试验 而 言 ,X1,…,X, 都 独立 ,而 分 
布 为 

第 一 串 :P(X;=1)=p,P(X;=0)=1-p 

第 二 串 :P(X;=1)=p;,P(X;=0)=1- yp. 

对 第 一 串 有 天 (X)= pit+…+p, 二 np, 对 第 二 串 也 有 E(X)= 
np ,本 者 同 ,对 方差 而 言 , 则 
第 一 串 :为 oi=np(l1—p) 


第 二 串 : 为 oj = > Padl 一 


of - oj = > ~ np” = 2 (7p; - p) 宇 0 
j 二 一 
等 号 当 且 仅 当 p1=…= p= 时 成 立 . 


直观 上 看 这 结果 的 解释 如 下 :如 果 pjy+… 十 pp 三 np 而 站 
pb, 不 相同 而 较 分 散 , 则 其 中 会 有 一 些 比 p 更 接近 0 或 1. 而 这 导 
致 方差 的 降低 ,因为 ,p;(1 一 pp;) 当 p; 守 0 或 1 时 很 小 . 

16. 因 0 志 XX 志 1, 故 0 才 E(X) 声 1, 以 及 X* 声 XX. 故 
Var(X) = E(X*)— ES:(X)<E(X)- EE:(X) = EX(l - EX) 
但 孙 数 x(1 一 xz) 在 0 二 xX 三 1 内 不 超过 1/4, 而 0 三 EX 荆 1, 故 证 明 
了 Var(X)1/4. 

从 上 面 推 理 可 知 ,为 要 成 立 等 号 ,有 两 个 条 件 要 满足 : XX* = 
X,EX=1Z2. 前 一 条 件 决定 了 X 只 能 取 0,1 为 值 .后 一 条 件 决 定 
了 P(X=0)= P(X=1)=1/2. 这 是 唯一 达到 等 号 的 情况 . 

对 一 般 情 况 a 二 Xb, 可 令 Y=(X-a)/Ab5-a). 则 0 二 YY 
委 1 因而 Var(Y) 达 1/4. 但 Var(X)= (6 一 a)*Var(Y), 故 有 
Var(X) 夺 (5b -a)*/4. 等 号 只 在 下 述 情 况 成 立 :P(X=a)= P(X 
=pb)=1/2. 

17. 分 别 以 X,Y 记 二 人 到 达 的 时 间 , 则 等 的 时 间 为 
1X 一 了 |. 而 平均 等 待 时 间 为 


0060 


| jx 一 y|/3600dxdy = 20( 分 钟 ) 


0 0 


18. 在 计算 | > f(x) dx 时 分 为 | (nm 7) f(r)dz 


十 | (Cz 一 m)f(x)dz. 


19. 任 取 44 关 训 .例如 a 之 m, 则 
EIX-al—- ElIX-m| 


-| [ral- lr- ml]f(r)de 
-| [lr-al- [rml]f(r)dxr 


+| [lz-al- Ix- mllf(xr)dr 
在 - ce 和 zx 委 记 1 内 有 Ir-4a|j 一 |x-nmn| 宇 -mm 一 a. 故 
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第 一 积分 之 - 《72 一 a| ”Hz)dz >- 3(m 一 a)(nm 的 害 
叉 1) 而 在 Mi <vx<oco 内 有 | 过 -wjl- | 之 一 7| = (p71 一), 邦 

第 二 积分 = (mm 一 a)| f(z)dz = 3 Cm —a) 

二 者 相 加 ， 得 ElX-a| 
-大 -| 宇 0. 对 a > pi 的 情 
况 也 类 似 处 理 ( 请 读者 完成 ). 

21. 计算 Y = XIX, 的 分 布 
商 数 F(y) = P(Y 过 vy). 事 件 !Y 
所 相应 于 (XI,X,) 落 在 图 5 中 
的 区 域 A 或 B 内 . 因此 有 


图 5 


F(y) = (dete)deidrs + rd)alra)drde 
固定 Xl 先 对 XT) 积分 ， 得 


(y)= | Fz) | sza)drs]dz 
+ fd)|) aC)dr a 
两 边 对 y 求 导 , 得 Y 的 密度 函数 h(y) 为 
h(y) = | f(r) (> -jdz， -| f(r)g (> -jaz 
计算 ECY) = | _yA(y)dy .注意 当 zi > 0 时 有 
| wg (> -jay = = zi| yy)dy = riE(X,) 
而 当 xi <0 时 有 


| xs (>)ay 一 zi yg(y)dy 一 一 XiE(X,) 


因此 
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E(Y)= | yh(y)dy = E(x (| rf lr dz 
0 
+] zf dr)= E(X»)E(X!) 
第 四 章 


2.(a) 只 须 注意 : 若 ci<c2, 则 g(a)= 1a-al+|c2~al 当 
且 仅 当 c 志 4 过 cs 时 达到 最 小 值 cy 一 c. 故 如 把 ai ,…,a, 按 由 小 


到 大 排列 为 a 人 a 0 … 信 Qn); 则 将 h(a) 写 为 > ， la -al 一 
7 = 上 


(ar-al+lar-al)+(ao-al+lao-b-al)+… 后 ， 
可 以 看 出 :为 使 此 式 达 到 最 小 ,a 必须 落 在 下 述 这 些 区 间 的 每 一 个 
之 内 : Lad),ac6o0) jy [LaosaG6-1).;Lao)sa(n-2)14，,"…. 如 为 奇 
数 , 适 合 这 条 件 的 唯一 的 a 是 actow. 如 为 偶数 , 则 [ ap)， 
acn2+1)] 中 任 一 数 a 都 适合 这 条 件 . 不论 在 何 情况 ,样本 中 位 数 
总 在 其 列 . 

(b) 极 大 似 然 估计 直接 由 (a) 得 出 ,为 样本 中 位 数 ,和 矩 估计 为 
X. 

3. 总 体 均 值 为 39 2, 故 矩 估 计 为 2X /3. 样 本 (Xl,…,X,) 
的 似 然 孔 数 为 
jo "1 0 min( KX) < max( X,) < 20 


I ,X00 
A 10， 其 他 情况 
可 看 出 极 大 似 然 估计 为 了 max( X1,…，X,) 
4. 因为 积 
oo 1 ) 1 
oo io ~ op(- 20 5 jd 


是 NGCa ,co-) 的 方差 ,为 0 , 故 立即 看 出 ziaya) 为 概率 密度 团 
数 .由 对 称 性 知 此 分 布 均值 为 a , 故 a 的 矩 估计 为 六 .此 分 布 的 方 
差 为 3o7, 故 得 5 的 年 估计 为 5 307 ree 一 义 )-. 
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取 似 然 函 数 的 对 数 ,分 别 对 a- 和 oa 求 偏 导数 ,得 到 决定 极 大 似 
然 仿 计 的 方程 组 


“1 _ 

227r wa- 7-(X—-a)=0 (1) 
-。 1~ > 
0” 二 37 (XN 一 a)- (2) 


一 个 至 代 解 法 是 : 先 给 定 a 的 初始 值 ao( 例 如 ao= X ,但 必须 X 
和 天 Xi; 对 任何 站 ,由 (1) 式 解 出 o 之 值 25. 以 oo = 05 代入 (2) 式 解 
出 a 的 下 一 个 值 a1( 这 是 一 个 a 的 二 次 方程 ), 以 4a=al 代入 (1) 
解 出 co: 的 下 一 个 值 of. 继续 下 去 直到 (a,,o5) 与 (a,41,07141) 之 
差别 小 于 指定 界限 为 止 . 
5. 先 算出 
| ‘eM /XIdA = 1/2%1,X = 0,1,2,. 


即 知 4 的 后 验 密度 为 2*' e “MX*/X1. 其 均值 , 即 (X+1) 人 从, 为 A 
的 贝 叶 斯 估计 . 

4 的 MVU 估计 为 XX. 当 义 取 大 值 (具体 说 ,X 宇 2) 时 , 它 大 于 
中 叶 斯 估计 (X+1)A2. 请 解释 一 下 其 原因 . 

6. 先 算出 样本 (Xl ,…,X, ) 的 边缘 密度 


| ae Are ms a = (n+ 1)!/Al+nX)" 
由 此 算出 4 的 后 验 密度 的 均值 为 
{(1 + nX)" /n+ 1)! | ea wed 


= (n+2)/(1] +nX) 
这 就 是 4 的 贝 叶 斯 估计 .你 对 这 个 估计 与 通常 估计 叉 比较 ,有 何 
评述 ? 
7.(a) 考 虑 N+1 个 球 , 自 左 至 右 排 成 一列 ,如 图 6. 现 要 从 其 
N+]1 
中 拿 出 41 个 , 拿 法 有 | ，，| ] 种 .将 拿 法 作 如 下 的 分 解 :固定 列 
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攻 | 6 
中 的 第 向 +1 个 球 。 将 a 拿 出 ,并 在 a 左边 拿 出 x 个 
772 A 一 777 
[合法 有 { ”种 | ,在 a。 有 边 拿 出 nz 个 [ 拿 法 有 |[ ”| 种 | 
因此 这 样 的 拿 法 有 | ”}| ”种 .再 让 a 由 位 置 1 流动 到 N+ 
,人 i 
1(m 由 0 到 N). 所 得 出 的 拿 法 显然 无 相 重 的 并 无 遗漏 的 .由 此 得 
出 所 给 的 组 合 等 式 ， 
(b) 在 所 给 先 验 分 布 之 下 ,X 的 边缘 分 布 为 


P(X = x)= Dp(M = KP(X = 7x) 


中 三 各 


oS 


k=0 \ 完 Rn 


-op Ga 


L ?77 十 


z=0,1,…,n. 如 此 得 到 M 的 后 验 分 布 为 


PIM= m|X)= 号 人 (人 人 


17 二 (01 AN 
此 分 布 之 均值 , 即 
500 = ")/ 
) NTATZ ZL 到 一 万 n (3) 


为 M 的 贝 叶 斯 估计 .上 式 中 的 和 等 于 
S00) 2) ") 0 


mm 二 0 
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N+1—-(m+1) 
n 二 1 一 (x 十 1) 


m+l 
第 一 项 可 化 为 (z +1)| 


T+l1l 


) 因此 ,由 (a) 中 
_ N+2 
证 明 的 组 合 公式 ,(4) 中 的 两 个 和 ,分 别 等 于 | “(z+ 1) 和 


(2) 以 此 代入 (3) 式 并 化 简 , 即 得 所 要 的 结果 . 


8. 考虑 先 验 密度 pr(1 一 p)*( 可 以 是 广义 的 ). 得 到 贝 叶 斯 估 
讨 为 (+at1)/ntat6b+2), 取 a=c-1,b6 二 dq 一 c 一 1 即 可 . 

9.(a)X(X—-1)/n(n 一 1)].(b) 若 $B(X) 为 g(p) 的 无 偏 信 
计 , 则 


a(p) = EB(r) = > pO | jz (1 


而 右边 为 pb 的 不 超过 n 阶 的 多 项 式 . 由 此 可 知 , 像 e ?,1/(1 + p-) 
等 ,都 没有 无 偏 估计 .还 有 一 个 有 趣 的 事实 : 令 g1(p)=p 
gx(p)=p",g3(p)= pp”, 则 gi1(p),g2(p) 都 有 无 偏 估计 ( 见 
(ce)) ,但 g1(p)g2(p)= 二 g2《p) 则 没有 . (ee) 只 须 证 明 : 对 任何 自然 
数 & 委 2 , 有 无 偏 估 计 . 直接 验证 :px* 的 无 偏 估计 就 是 X(X 一 1) 
“(Xk+1)/n(n -1)…(2 一 R+T): 
E[X(X—1)-(X—-k+1)/n(n 一 1)…(02 一 下 二 1) 
二 > [ii 一 1)…(7—k+t1l)/An(n 一 1 (2 一 有 十 1) 


i=0 


: [" ple 一 轧 )” 


2 © A iP Le 


=0 


0 


邻 n 一 上 = 二 1 ,1 一 二 了 ， as ‘Jp p)™ 二 大. 


7=0 


10. 依 第 二 章 23 题 min(X Xi 本 0 一 max(X1，…，X，) 
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同 分 布 .因此 二 者 之 均值 相同 ,由 此 得 
El[min(X1,*…, X,) + max(X1,*…,X,)|]=0 
这 证 明了 (a). 又 由 第 二 章 22 题 知 min(XX| ,…, XX, ) 的 概率 密度 为 


1) (省 0<x<0, 此 外 为 0), 其 均值 为 9/(n+1). 由 


此 可 知 , 令 C= 二 7 二 1, 则 Cmin(XX1 ,…,XX, ) 为 8 的 无 偏 估 计 . 这 
证 明了 (b). 为 证 (c), 只 须 算出 Var(C,min(Xi,…, XX,))= (n+ 


9 天 一 上 
1)? 如 ea 人 1 _ | dr 一 名 = n/n +2). 与 例 3.5 比较 即 


得 ( 问 :由 Cmin(X1,…,X; ) 的 方差 表达 式 看 出 这 个 估计 之 不 合 
理 处 ,在 什么 地 方 ? n 佑 大 ,其 方差 非但 不 下 降 ,反而 上 升 , 即 
样本 愈 多 ,估计 误差 愈 大 了 ). 

11.(a) 有 


网 9 ~ -A 
E[0(z)] = 2 (i) TA = ee 
i=0 " 


> 8) CD ,因此 (i) = (一 1) 
这 估计 之 不 合理 显然 ,一 合理 的 信 计 可 取 为 e 27. 
12. 用 ECV) 由 于 (n -1)bivo: 一 
xX -1, 知 
E[01 =- oP= (nn 1) ?oFE[(n -1) 0./0? -(n—1)1 
= (nn -1) ?orVar(y? 1) = 204/(n -1) 


为 一 方面 ,有 
n-la 2 7 一 ]、 人 > 2 nC]. 
E [2410 | = (E(2F10)- 0) + Var 人 让 
2 2 一 1: 人 
= ( i ge 十 TT ) Var(@1) 


由 此 得 出 要 证 的 结 采 . 
13. 与 12 题 一 样 ,用 Var(XY2)=272 ,有 


人 4 7 ~ 
Var(03) = “3Var( x%) = 0” < Var(01) 


这 证 明了 (a). 为 证 (b), 要 用 克拉 美 - 劳 不 等 式 , 以 o7 作 9,g(0)= 
90. 算 出 


1(o2) = E23 - a(X -a)?| = 1/(201) 


于 是 o* 的 无 偏 估 计 之 方差 下 界 为 
1/(nl(o*)) = 20/n 


与 Var(0;) 相 同 .由 此 证 明了 所 要 的 结果 . 


注 :者 令 抽 = 一 二 六 (Xi - a). 由 12 题 的 证 法 ,B64 的 均 方 
i=1 


误差 为 2oc4/A(n + 2), 比 93 的 均 方 误差 ( 即 Var(03)) 小 .由 此 例 可 
知 ,MVU 估计 的 均 方 误差 不 一 定 是 最 小 的 . 
14.(a) 因 为 作 变 换 x=vV y/0 可 得 


| re 22dr = 932| yl ?e »/2dy 
0 0 


> 32T(3/ 2) = 二 Vx0 2 


即 知 E(X? )= 翅 . 故 令 C=2 即 可 .其 次 ,算出 


本 - Var( X?) ~ 2/(n0’) 
再 用 元 拉美 - 劳 不 等 式 , 先 算出 
1(9) = E[ 志 -~ X?] = 17202) 
而 g(0)=1/0, 故 g (0)= 一 1/0* 而 
(g’(0))/n1(0) = 74/ (二 9) = 2/(n07) = Var( 二 > x? 


于 是 证 明了 所 要 的 结果 . 
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1$.(a) 用 第 三 章 定理 3.1,2” ,有 

Var( 1 2)=E | 六 (3 一 0) + 二 (O20) 
[E(B1- 0) + E(62- 0)] +7E[(, -0)(0,— 0)] 
[E(B, -902+ E(0,- 0)]+ 5[E(O _ 9)? 


E(9, - 0)2]3 


由 于 601,60, 都 是 9 的 MVU 估计 ,其 方差 相同 且 都 达到 最 小 值 
c(9). 由 上 式 得 


Va (2 人 < Jrc(g) + e(0)]+ ec(0) = 0(0) 
即 无 偏 估 计 (91+ 0)/2 的 方差 不 大 于 最 小 值 (9), 因 而 它 必 为 
MVU 估计 . 

(b) 用 反 证 法 ,着 a09+ 不 为 a28+6b 的 MVU 估计 , 则 可 以 找 
到 a9+5 的 一 个 无 偏 估计 6 ,使 

Varg (01) < Vare (a6 + 6) = a2Vare (有 
至 少 对 一 个 9 值 90. 令 9;= (9 | 则 8, 为 9 的 无 偏 估 计 , 且 
Varg, (0,) = 3Vars, (01) < a “Vare， (0) = Vare (0 ) 


即 无 偏 估计 6 的 方差 , 当 96= bo 时 比 无 偏 估计 6 的 方差 还 小 这 与 
6 的 是 9 的 MVU 估计 矛盾. 
16. E(D ex X; ) = DE(X) = 96 = 6 故 补 cX 为 无 
偏 估 计 ， 其 方差 为 (5? _ var(X ) ) 
Var( De ) = > var( x = oe? 
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2 > (c;— 1/n) + 1/n | 衬 og*/n 
i=1 
等 号 当 且 仅 当 Cl 一 一 cy， = 1/n 时 十 成立. 


17. 因为 max( 久 |,…,X, )( 记 为 9) 的 密度 函数 为 ?zz2 1/9” 
( 当 0<z<o0, 此 外 为 0). 故 


Pi 二 bg 过 cp)= Pb OKO) 


0 ， 
一 | nzx” ldr/0" = (0 — (0/c)")/" = 1 ce” 
BO/en 


要 此 值 等 于 1- ,只 须 取 c= (一 ) 

18.(a) 只 要 c+d=1, 则 cX +dY 为 9 的 无 偏 估计 ,其 方差 
为 c*o 1/n+d’ 0g3/ 7. 把 此 式 在 c+ 4=1 的 约束 下 求 最 小 值 , 结 
果 为 

= (os/m)/(oi/n + of/m),d = (gf/n)/(oi/n + o3 /7 ) 
对 这 个 c,d 有 

(cX +dY -0)/A ~ N(0,1) 

其 中 A7= (ai ci] ) [cft]a +o3/pi). 于 是 得 到 9 的 置信 系 
数 1 一 a 的 区 间 估 计 为 cX +dY + Au,b. 

19. 考虑 

2A1nX /2AnY =2 


分 子 分 母 独立 ,分 别 服从 卡 方 分 布 x5, 和 x5;,. 故 


、 MX _, /ea )- 
p( Fan 人 (1 -$< $< 27 ,2 ($$))=1-。 


此 式 可 改写 为 
P($ /Fa2n ($< <$/Fa2nl1 - $))= 1 -a 
即 得 4,/AA1 的 置信 和 区间. 
”20.(0,X1,X;) 的 联合 分 布 密度 为 
f(0,Xi1, X2) = ee tit ,0 < 0 min(X),X,) 
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mint{ XX， ~ ,7 


由 此 得 出 (Xi, X2) 的 边缘 密度 为 | "ede ee = 
es 1+ Xa)fe min( XX,) 1], 而 9 的 后 验 密 度 为 

hn(0| Xi1,X;) = /fe 9) 1],0< 0 过 min(X,X,) 
此 外 为 0. 这 密度 在 上 述 区 间 内 随 9 上 升 而 上 升 . 故 要 找 一 个 最 短 


的 区 间 [a ,oj 使 | h(9| Xi,X2)d0 二 1 一 a ,b 必须 取 为 min(Xi， 


X;). 天 


e9d0 一 emint X,) ,5 ) 


min(X, ,XX,) 
2 a 
| -ae 


wt 


知 a 必须 取 为 log[ ae™™ XX2) +1—-al. 
21. 由 (nn 一 1)S“/o 一 xX;_1, 从 卡 方 分 布 密度 的 形式 ,不 难 算 

出 S/o 的 密度 图 数 g&(s) 为 :8g(s)=0 当 5 委 0, 而 
g(s) = (nw D2 -Oh Sn-2 


ve s~>0 
In- DT (2 ) 


为 计算 E(S)=o | sg(s)ds, 只 须 在 积分 


| iexb| -人 了 Ds- jd 


中 作 变 数 代 换 上 =(2 -1)s 72 以 化 为 下 积分 即 可 . 
22. 作 代 换 Y; = (X; 一 01)/A0; 一 904),i = 1,…n. 则 六 |,…， 
Y， 独立 同 分 布 ,其 公共 分 布 为 [0,1] 上 的 均匀 分 布 R(0,1), 与 


0.0, 无关. 故 忆 (Sr) = BA 了 (Y; -了 /An -1) 也 与 01,6， 


无 关 . 记 为 d,. 有 S = > x: - XK)/(n -1)= (0,-0)Sy, 
故 E(S) = d,(0, 0,). 现 有 
E(X -cS)= (01+0)/2— cd,(0,- 0) 


E(K+ceS)= (01+0)/2+ cd,(0,- 06,) 
| * 387 。 


取 C,=1/(2d,). 此 两 式 分 别 成 为 60) 和 0:. 要 求 出 C,, 必须 算 出 
d 二 上 (Sy). 这 不 容易 . 
23. 设 此 结论 不 对 , 则 存在 9 的 无 偏 估计 工 , ,使 对 于 (90,0o”) 

的 某 个 值 (90 ,065), 有 

Vare ,a (T,) < Var6 ,a ( X) = ogi/n 
把 多 ,…,X, 看 作为 抽 自 正 态 总 体 N(0,0o5) 的 样本 ,6 未知 而 o5 
已 知 . 这 时 , X 和 也 , 仍然 是 6 的 无 偏 估计 . 且 因此 处 方差 ci 已 
知 .X 是 6 的 MVU 估计 .因此 对 一 切 0 应 有 

Vare,e2(T，) 之 Varg,2(X ) 一 of/n 
令 9=00, 即 得 到 与 前 式 矛 盾 的 结果 ,这 证 明了 XX 仍 是 9 的 MVU 
估计 . 


第 五 章 


1.1” 8(8)=1-— [| -6(2)].e 为 标准 正 态 
NO0,1) 的 分 布 函 数 . 
2” 这 归结 为 方程 组 


os) oe 
sc 人 -ec 


这 方程 组 可 以 用 如 下 的 倒 代 方式 ,借助 于 正 态 分 布 表 求解 :指定 
Cl 的 一 个 初始 值 CY. 由 (1),(2) 分 别 决定 出 Ci 的 各 一 个 值 , 若 二 
者 差距 不 在 容许 范围 内 ,其 算术 平均 取 为 C9 以 C3 代入 (1),(2)， 
分 别 解 出 两 个 Cl 值 . 若 二 者 差距 不 在 容许 范围 内 ,其 算术 平均 取 
为 Cl 的 下 一 个 值 Ci. 然后 以 Cl 代入 (1),(2) 中 之 Cj, 定 出 C， 
之 下 一 个 值 C:. 这样 继 续 到 某 次 定 出 的 两 个 值 差距 在 容许 范围 内 
为 止 . 


3” 记 @(z)=o(z)= 二 =e“, 易 见 8(9) 的 导数 为 
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0 


oO 


由 oO .0< 5 2 时 


g(0) <0,Y 0> HN 8 (0)> 
0, 故 3(9) 当 9 由 一 必 变 到 co 时, 先 下 
降 到 (Ci + C)Z2 点 处 达到 最 小 值 , 然 
后 上 升 ( 见 图 7). 由 于 B(a)=B8(5), 看 
出 &<(cli+c)/2<20, 而 在 [< ,bo 区 图 7 

间 内 ,8(9) 之 值 不 大 于 a. 

注 : 显 然 ,8(6) 的 图 形 关 于 点 (cl + c2)/ 2 对称, 由 此 可 知 ,a， 
与 (cl+c?)/2 有 等 距离 ,这 说 明 必 有 ci t+ cx =a +0. 这 个 事实 
提供 了 解 方程 组 (1),(2) 的 一 种 “try and error 的 方法 : 取 cl 的 初 
始 值 cq<(a+p)/2. 由 c=(a+bo)-c 定 出 cs 的 初始 值 c? 

这 两 值 代 人 (1),(2) ,车 右边 小 于 1- a, 说 明 c? 选 得 太 大 ,否则 
选 得 太 小 ,经 几 步 纠正 达到 接近 相等 为 止 . 

4" 此 由 lim B(x)=0 及 lim B(x)=1 立即 得 出 .表示 当 0 
之 真 值 与 原 假设 距离 愈 来 愈 远 时 ,本 检验 以 愈 来 愈 确定 的 把 握 否 
定之 ， 

2. 依 直观 考虑 ,检验 取 为 “ 当 ci; 委 驻 委 c; 时 接受 Ho ,不 然 就 
否定 五 0 .利用 2nAX 一 x5 ,一 切 与 第 一 题 相 似 ,在 求解 ci ,cs 时 
要 用 到 精细 的 卡 方 分 布 表 才 行 . 


3. 令 T=V 7-(X- Y )/o. 证明: 当 原 假设 成 立时 有 
TT 一 N(0,1). 由 此 作出 检验 : 当 |T| 志 wy; 时 接受 Ho, 不 然 就 耕 


定 Ho. 
算出 其 功效 函数 为 
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-@(- wa- 77177 4d) 


nn od 
其 中 4d =a 一 5. 令 上 式 右 端 为 1 一 dy, 解 出 4d 之 值 (有 两 个 ; 土 d1) 
其 正解 即 所 求 之 di1i. 


二 + nc” » 4 
4.X—cY -Na - 心 , 四 2g? ] 仿 照 两 样本 t 检验 的 得 


出 过 程 , 作 统计 量 


[mn(n+i+n— 2),s 二 
= (KX -ceY 
上 Vy 777 十 nc ( ‘ ) 


/ SX- XP + DY- YY) 


而 得 出 当 Ho 成 立时 本 一 1, 23. 由 此 得 出 检验 : 当 | 工 | 去 
tm+n_2(a/2) 时 接受 Ho, 不 然 就 否定 Ho. 

5. 作 变 换 X; = cX,,…, i= 1,n. 考 虑 两 组 样本 

XXX 和 Yi, , YY,, (3) 

它们 都 有 正 态 分 布 ,等 方差 c3 ,但 X; 之 均值 为 a = ca ,Y; 之 均值 
为 5. 故 就 样本 (3) 而 言 ,原来 的 假设 Ho 转化 为 a = cv. 因而 转化 
为 第 4 题 . 

6. 利用 AyXX A(A2Y ) 一 F,, .2% 这 个 事实 . 

7. 记 械 =max(Xi,…,X,). 从 直观 上 看 ,9 愈 大 ,人 丁 也 愈 倾向 
于 取 大 值 . 故 一 个 合理 的 检验 为 : 当 TsC 时 接受 已 0 ,不 然 就 否定 
于 .为 定 C, 计 算 其 功效 函数 (这 用 到 丁 的 分 布 ,参考 第 二 章 22 
题 ) 


B(6) = P(T>C)=1-(C/0)" 
它 是 9 的 增 困 数 , 故 为 使 8(0) 志 a 当 0 委 四, 只 须 使 8(00)=a 即 
可 .这 定 出 C=(1-a) “04. | 
注 : 有 人 可 能 这 样 想 :4 愈 大 ,了 = min(X1,…,X, ) 也 倾向 于 
取 大 值 . 为 何不 用 基于 Ti 的 检验 ? 理由 在 于 :TT 中 所 含 9 的 信 
上 县 不 如 开 多 ,这 一 点 可 参考 第 四 章 10 题 .进一步 可 以 证 明 : 基 于 
本 的 上 述 检 验 ,是 Ho 的 一 致 最 优 检 验 . 这 一 点 用 附录 A 的 方法 
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个 难 证 明 . 

8. 从 f(zx,9) 的 图 形 ( 见 图 8) 看 
出 :观察 值 X|,…,X, 落 在 0 附近 的 可 
能 性 大 ,所 以 工 = min( 义 | ,…, 义 , ) 接 近 
9 且 包 含 了 6 较 多 的 信息 .显然 , 当 9 大 
时 ,了 倾向 于 大 . 故 Ho 的 一 个 直观 上 合 
理 的 检验 是 : 当 了 委 C 时 接受 万 ,不 然 
就 否定 Ho. 为 要 根据 水 平 a 决定 C ,要 风 8 
算出 械 的 分 布 .这 可 按 第 二 章 第 22 题 
解决 ,但 下 述 观察 简化 了 问题 : 令 X,; = X, 一 9,i 二 1,…,n. 则 易 见 
Xi 有 指数 密度 e“ 当 (z>0.z 生 0 时 为 0). 从 此 出 发 用 第 二 意 22 
题 , 匈 得 了 = min(XX!,…,X;) 的 密度 函数 为 ne- 下 ( 当 >0.zr 声 
0 时 为 0). 由 于 全 = T+9, 得 出 工 的 密度 函数 g(x ,9) 为 


—n(txr—0) 
0 4 
g(x,0) -1 人 人 > 


0 ， XO 
因此 上 述 检 验 的 功效 函数 为 
B(0) = Po(T > C) = | ae ”dz -- @~n(max(c,0)-0) 


此 为 9 的 增 函 数 (何故 ?) 故 为 使 8(0) 二 a 当 6 妥 6, 只 须 使 8(0。) 
= uv. 这 定 出 C=4+7rlog( 一 
9. 从 直观 上 易 理 解 应 取 接 受 域 为 X>C,C 为 整数 .因为 p 
愈 小 ,为 出 现 > 次 事件 A 所 需 的 总 试验 次 数 就 倾向 于 大 ,上 述 检 
验 的 功效 函数 为 
C ( +k-l1 


B(p) = 之 _ jz 一 p)* 


需要 证 明 它 是 p 的 非 降 函数 . 这 用 概率 方法 证 最 容易 . 如 第 二 音 

习题 7(5) 的 做 法 ,设想 一 个 试验 有 三 个 互 斥 的 结果 Ai,A，A，， 

其 概率 分 别 为 p1 ,ps 一 pl 和 1 一 户 . 此 处 0 才 p1<p 志 1. 邻 A= 

lt+ A;, 其 概率 p,. 以 X| 记 到 事件 A| 出 现 > 次 时 的 试验 总 次 
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数 ,以 X, 记 到 事件 A 出 现 > 次 时 的 试验 总 次 数 , 则 8(p1) = 
P(XI-r 志 C),B(py) = P(X 一 r 声 C). 由 于 总 有 Xl 之 Xi, 如 
{Xi 一 r+ 入 CiCIX; 一 r 忆 C1 因而 8(pi) 志 BB(p2). 这 证 明了 B(p) 
的 非 降 性 . 故 为 使 8(p) 二 a 当 p 志 po, 只 须 找 C, 使 
C gl1 
pp) = Do 1 p= 
若 不 存在 这 样 的 整数 C , 则 找 C ,使 


C 


Cc y+-1 
> 人 ja - bo) < a 
k=0 六 

C+1 


-I/r+k-l]l 
< >| 和 ja ~ po)’ 


k=0 


把 上 式 左 右 两 边 分 别 记 为 A ,B. 则 准确 达到 水 平 a 的 随机 化 检验 
为 :大 X 委 C ,否定 Ho; 若 关 之 C+2, 接 受 Ho. 若 六 =C+1, 则 以 
概率 


- > - ‘Jil -po - A) 
(aa 
| 


， “jx - po 


接受 Ho. 
10. 在 得 到 观察 值 X 时 ,在 所 述 先 验 分 布 之 下 , p 有 后 验 密 
度 


1 ， 
h(p|X)= Bl(r+l,r+1)? (1—p) 


要 计算 积分 | p"(1 -pp)*dp/B(r +1,X+ 1), 看 是 否 超 过 172 
此 积分 称 为 “不 完全 8 积分 ”, 有 表 可 查 . : 
11. 因为 样本 (XX ,… ,XX, ) 的 密度 函数 为 
f(Xi1,%, Xa;0)= 0 ", 当 max( XI,…:, X,) 二 TAO 
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= 0, 其 他 情况 
故 得 在 所 述 先 验 分 布 之 下 ,(XIi,，…,X,) 的 边缘 密度 函数 为 
] 


- np) 1) 
hn(X1,, X,) = | 4 dg= rztT a ] 


( 当 0 委 了 T 委 < .其 他 处 为 0). 由 此 得 9 的 后 验 密 度 为 
(0| Xi1,,X,) 
_ jn 1)07/AT HD a TOAZa 
\ 0 ,其 他 处 
然后 计算 


0 
| "nC0| Xi X,)dg 


上 7 _ bocD)MT-OcD -arorD,9 >T 
0 ， 0 云 工 
视 其 值 是 否 大 于 17 2 而 决定 是 否 接受 Ho. 
12. 按 甲 的 做 法 ,否定 域 为 X 委 C,X 为 第 9 次 出 现 A 时 ,A 
出 现 的 次 数 ,其 功效 函数 
. 


BI(p) = P(X <C)= >) 


£0 


为 p 的 非 降 函 数 (第 9 题 ). 为 定 C, 应 使 


2 本 81(1/2) = 0.05 
当 C=2 时 上 式 为 0.033,C=3 时 为 0.073. 故 如 严格 要 求 水 平 为 
5% , 则 按 第 9 题 , 当 C=3( 即 甲 的 试验 结果 ) 时 ,应 以 概率 (0.05 一 
0.033)/(0.073 一 0.033)=0.425 否定 Ho. 所 以 , 按 甲 的 结果 ,是 
否 接受 五 , 还 不 一 定 . 

按 乙 的 做 法 ,否定 域 为 Y>C,Y 为 第 3 次 A 出 现时 ,A 出 
现 的 次 数 .其 功效 函数 为 

Bp)= POY>C)=1- 六 人 “ja — pp) pe 


此 为 p 的 非 降 函 数 (何故 ?) ,为 定 C ,应 使 


p" (1 p)* 


k 
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1 - > (了 2 pg,(1/2) = 0.05 
当 C=8 时 ,此 式 之 值 为 0.0327. 因 此 ,否定 域 iY> Ci 中 的 C 值 
不 能 大 于 8. 所 以 ,凡是 大 于 8 的 Y 值 ,都 要 否定 Ho. 现 乙 的 试验 
结果 为 Y=9, 故 Ho 必 被 否定 . 

本 例 有 趣 之 处 在 于 :表面 上 甲乙 二 人 试验 结果 完全 一 样 ,都 
是 在 12 次 试验 中 ,A 出 现 9 次 , A 出 现 3 次 .但 由 于 出 发 点 不 同 
而 导致 模型 有 所 不 同 ,影响 了 检验 结果 .也 有 人 把 这 类 例子 看 成 是 
现行 统计 方法 的 缺陷 的 证 明 ,因为 他 们 认为 :同样 的 数据 应 导致 同 
样 的 结果 ， : 

13. 当 ml, nz 充分 大 时 有 (X - np1)/Vnpi(l-pi) ~ 
N(0,1),(Y-n2p2)/V np2(1 一 py)~N(0,1). 故 近似 地 有 

X/ni ~ N(pi,pi(l - pi1) /ni1), 
Y/n2 ~ N(p2, ps(1 — p2)/no), 
因而 近似 地 也 有 
ZX/ni- Y/ns ~ N(p!l— p,0°) 
其 中 = pi(1 一 p/nit+ po(1 一 2)/2. 如 如 已 知 , 则 检验 
p11 一 p2 二 0 相当 于 检验 正 态 变 量 Z 之 均值 为 0, 其 否定 域 应 取 为 
|Z 之 ousp. 现 of 未知, 可 以 用 
6* = Pi1(1 ~ Pi)/ni + Poll — $2) /no 
去 估计 之 ,$1= XALal,z = YA ,最 后 得 出 Ho: pli 二 ps 的 大 样 
本 检验 的 否定 域 为 
| X/n1 — Y/n2| > ural (X/n1)(1 — X/n1) 
+ (Y/n2)(1 — Y/n2)1? 

14.(a) 先 设 =? 7 为 自然 数 . 这 时 XX 一 P(n) 可 表 为 X= 
和 1 十 … 十 六 ,1，,…,XX, 独立 且 各 服从 波 哇 松 分 布 P(1). 因 XX， 
的 方差 为 1 , 按 中 心 极限 定理 有 (XI+…+X, -nn)/A/n->N(0.1) 
即 (X -2)Az 一 NO,1) 当 ， 不 为 日 然 数 时 , 设 nA<ntl. 
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| 式 , 有 XI+…+XSXsXI+…+Xorl 有 


入 “二 + 义 , 一 nn 一 1] _X-i1 Xi+ + Xrl— 7n 
A < < 所 (4) 
但 
六 1 十 Oe -Vz 志方 
VA 
Ce : 0 


1AMNX->0, 知 (Xj+… 二 XX, 一 nn 一 1)NA 一 N (0,1). 同 理 证 明 
(XI++ XX,+1 一 n)ANA—>N(0,1). 由 此 及 (4) 式 , 即 证 明了 
(XX 一 4)NA 一 N(0,1) 当 2 一 吕 .(b) 否 定 域 可 取 为 |X -Aol/V ho 
> U2. 
16. 记 题 中 之 公共 比值 为 6, 则 易 见 
P(X=i7)= 0 1/(1+0+0+0),1:=1,2,3,4 
是 得 似 然 函 数 
L(0) = llP(x= 2)]™ = O23 (I + Ot+ 0 + 0)- 
由 此 各 时 到 决定 9 值 的 方程 d(logLkb))xdo=0, 即 
(n2 + 2ns+ 3n4)/0 ~ n(l +204+30)/(1+06+0+0)=0 
遍 乘 6(1+0+62+63), 得 到 6 的 一 个 3 次 方程 , 它 有 公式 求解 . 
如 有 多 于 一 个 实 根 ,还 须 逐 一 代入 二 (9) 中 ,看 哪 一 个 达到 最 大 ， 
一 个 就 取 为 6 的 估计 值 9 . 因 只 有 一 个 参数 b, 自由 度 应 为 4-1 
-1=2. 
17. 按 指数 分 布 , 落 和 区间 I 内 的 概率 为 


p24) =] v2 Ae dx = ei De(] - er),i 一 ],…,k 


pri(A) -| Ae “dz 一 e a 
暂 记 0=e * ,得 到 似 然 函 数 


Eft1 


L(6) 一 TE Ep 一 (1 _ 站)7 ner at emt tka 
i-l 
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使 LL(9) 达 到 最 大 的 9 为 


0 = (13 + D3 tt horart) /ny + 2n2 te + kn + kngrt) 
相应 地 得 出 4 的 估计 
A = a llog(1/0) 
拟 合 优 度 统计 量 的 自由 度 为 (R&R 二 1) 一 1 一 1= 有 一 1. 
19. 1” 只 需 注意 2 的 表达 式 (3.2) 中 , 当 原 假设 成 立时 ,有 
vy; 一 Bn,p;). 故 (np; 一 vy;)* 就 是 二 项 分 布 B(n,p;) 的 方差 , 即 
npi(1 一 p;). 改 


不 
E(Z)= Ep, — y;)* /np; = 2 np 一 p;) /np; 
-1 


= Du-p) =- pi:=k-1 


2” 要 算 var(Z) , 须 计算 E(22). 这 涉及 到 以 下 两 种 类 型 的 
量 的 计算 :E(npi 一 v1),E(npi 一 v1) (nps 一 v2) .前 者 较 易 , 它 
归结 到 E(X') 的 计算 ,X 一 B(n,p). 这 可 以 利用 
E[X(X-1)…(X-i+1)/n(n-1)(n-it+1)j=p’' 而 
得 到 (第 四 章 习 题 9) ,第 二 种 类 型 的 量 归 结 为 形 如 
EL[Xi(X1— DXAX; ~ 1)1,ELXI(X! — 1)X;|, 
E(XIX,»),E(X) 
等 的 计算 ,其 中 (Xj,XX;, XX) 服从 多 项 式 分 布 M(n;pi,p,p;) 
(第 二 章 例 2.2) ,这 可 以 仿照 第 二 章 例 4.1 那 种 方式 去 处 理 , 例 如 


_ 加 天 7 | 
E[XI(X1 -DXA(Xs -1D] = 2 FT 


(i i(io— 1)prpz(l — pi — p2)” i 
> ”表示 求 和 范围 为 :i1 ,i 为 非 负 整数 ,il + i 过. 上 式 可 写 为 
Ga i= 1 -2,i ;2= 2 一 2) n(n — 1)(n -2)(n — 3) x 


> (nn — 4)! 让 p 闻 一 n—4-i i 
之 ii 一 4 一 2 一 7 1 Pip2(l p1 一 po) I 1 。 
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pp3,，>) 表示 求 和 范围 为 :i1, i 为 非 负 整数 ,i1+ i2 人 nn 一 4. 上 
式 中 之 和 为 1. 故 得 
E[XICXI — DXs(X2—1)] = a(n- Dn—2)(n— 3)p1ips 
其 他 量 类 似 计算 ,最 后 经 过 整理 得 到 Z 的 方差 (在 原 假设 成 立 下 ) 
表达 去 为 
Var(Z) = 2(k—1)—(k*+2k-2+ 2 1/p.) /mn 

其 极限 ( 当 n 一 00) 为 2(k 一 1), 即 Xx%-1 的 方差 . 

20. 方法 与 附录 A 中 讲 的 完全 一 样 ,考虑 1 取 定 p11 po, 考 
虑 简单 假设 检验 问题 : 

Ho:p = posHi:p = pi 

证 明 :(2.38) 式 定义 的 检验 p 是 此 问题 的 一 致 最 优 检验 .证 明 这 
一 点 的 方法 , 按 附录 A ,只 是 归结 为 验证 :对 否定 域 中 的 任 一 点 
和 接受 域 中 的 任 一 点 7/, 必 有 z 


(7 Bt 一 p1)” « (joa — p11)™ 
nV 
( ju 一 po)” * ( jad — po)” 


然后 注意 到 检验 g 与 pi 无关 ,是 p 作为 p 肆 po 的 检验 也 有 水 平 
a 即 可 .. 


第 六 章 


1. 记 S?2= > (Xi 一 六 ,SI = > (xX,- xX)Y, 
i=1 i=1 


2 (Y; - ago — al(X; 一 X)) 


| ni 
.C22 1 2 _ 7 BB 
= 5S CT 25 Ql] 十 nag 2nYoao 十 全 YY’ 
i=1 


(Sal - SI/S) + n(ao—- YY 
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MY ~ nY’— Si/S? 


由 此 立即 看 出 此 平方 和 之 最 小 值 在 C0 一 Y= Bo 和 gl = SI /S*= 
B! 处 达到 , 且 最 小 值 为 


> 62= DY? -nrY’— Si/S’ 
i=1 7 - 
= > 人 一 SiS3 


= DY -~ Y) -BS 


即 (2.23) 式 ， 这 个 证 明 不 仅 简单 还 有 一 个 好 处 , 即 它 确实 肯定 了 
达到 最 小 从. 用 偏 叶 数 方 法 ,理论 上 还 有 一 个 验证 方程 组 (2.10)， 
(2.11) 的 解 确实 是 最 小 值 点 的 问题 . 


2.(a) 利 用 Bo ,Bi 的 无 偏 性 ,因为 
0; 一 Y; Y, 一 Bo + BI(X; 一 X ) 十 ei; 一 (Bo 十 81(X， 一 X )) 


= (B06 — Bo) + (BI ~ BI)(X; — XK)+e 
且 E(e,)=0, 即 得 E(5,)=0. 


得 到 p+ “+ 人 6, 01 8, 之 间 既 然 有 这 样 一 个 函数 关系 ， ， 
它 不 可 能 是 相互 独立 的 . 

(c) 在 证 明 (2.21) 式 的 过 程 中 已 得 出 
6; = ei—-@-— 1 die/8? (1; = X;— XX, = > /n) 


(1) 
又 由 (a) 有 上 上 (6;)=0(E(6;)=0 也 直接 由 上 式 得 出 ), 故 


Var(6:) = E(8:) = EU ~ o) + E(te) 
j=] 
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-21S 2E( > ie; )- 215 (> tiee;) (2) 
j=1 -1 

注意 到 天 (e; 一 as)=E(e?)+ E(e’*)— 2F(e )=a2 上 +a27]7z 一 
272/1 一 ao- =(1 1)yo ,以 及 

BE(>2o) = 2 > 好 一 52S2 ,已 ( 2 tee;)= 40 ， 

一 1 Es 

E(> fiee;)= D2/n =0 
代入 (2) 式 即 得 所 要 证 的 结果 ， 

注 : 由 这 个 结果 ,得 


E(D82)= SE(82)= > [1 -二 -人 (Xi ~ X)/S? | 
i=1 i=1 


= (n — 2)0° 
因而 得 到 Dn - 2) 为 的 无 偏 估计 的 另 一 证 明 . 


(g) 与 (1) 式 类 似 写 出 6, 的 表达 式 , 注意 Cov (56.， 3,)=E 
(6.6;) ,把 两 式 相 乘 逐 项 求 均值 ,与 (c) 完 全 类 似 地 得 导 到 所 要 的 结 
采 . 

3. 考虑 线性 回归 模型 

Y=aogtart+e,ao0o 三 al 一 已 一 人 (3) 
其 中 e 一 NG0,c). 在 X = 0 点 重复 观察 次 ,其 YY 值 记 为 X|， 
…,X, ;在 六 二 1 点 重复 观察 m 次 ,其 Y 值 记 为 Yi,…,Y,, .这样 
按 模型 (3) ,Xi,…,X, 一 Na cy yn 一 Noc) ,如题 
中 所 设 者 . 然 自 模型 (3) 观 之 ,估计 局- < 相当 于 估计 回归 系数 c ) ， 


从 验 亦 然 . 而 此 处 的 平方 和 (2.9) 为 > (X - ao)2+ > ( 呈 - a 
一 a1)* ,直接 得 出 2C0:Q1 的 最 小 二 乘 估 计 为 X 和 Y— X .后 者 即 
b -a 的 估计 . 残 差 平方 和 为 > (Xi 一 叉 + > (Y -也 ) .自由 


度 m+n 一 2. 又 此 处 之 SS 即 (2.16) 式 中 的 S: ) 为 (注意 自 变 
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量 值 中 个 0 和 m 个 1, 其 平均 为 mA(n+m)) 
S92= n(0—- m/(n+ m)) +m(l-— m /A(n + m)) 
= nm/(nt+m) 
由 此 , 按 (2.26) 式 求 a1=b 一 a 的 区 间 估 计 , 所 得 结果 与 两 样本 1 
区 间 估 计 一致 . 


4 将 平方 和 (Y -6bX; 按 第 1 题 的 方式 处 理 : >)(Y; - 
i=1 . i=1 
bXi)” = Sio- 一 2Solp + > Y? = (Sob — So1/So)” + 之 Y? — 


S31/S%, 此 处 Si = > x , So1 = > XY 由 此 式 立即 得 出 45 的 最 
小 一 乘 估计 为 
b$ = So/Si = SD XY 


而 残 差 平方 和 为 >) Y?3 - Si /Si, 暂 记 为 R. 由 于 
E(Y3)= (EY,)? + Var(Y;) = 2X3 + 
E(St)= (ES01)* + Var( So1) 


~ (DpxX?) + >) XY = 02S 和 + oS 
i=1 i=! 
得 到 
E(R)= 》 (02X2 + ao2) - (0 Sh + oS0)/S6 
i 二 1 


二 no? + b2Si -6bS6—-o = (2 一 1)0° 
因而 证 明了 RA(n -1) 是 o? 的 无 偏 估计 . 
(c) 只 须 作 一 个 正 交 变换 
Zi Yi 
: |=A 


Ln YY, 
其 中 A 为 正 交 方 阵 ,第 一 行 是 (X1/So,…,X,/So). 则 R= 23+ 
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… 十 2Z2 ,其 中 Z,,…,Z 独立 同 分 布 且 有 公共 分 布 N(0,o-)， 

$. 若 cj=0, 则 因 2 的 区 间 估 计 问 题 已 解决 了 ,cz6 当然 直接 
由 之 得 出 . 若 c 关 0, 把 cja +c>6 表 为 cl(c+zo)(z= cavcl), 即 
cl172(z). 因 和 (zz) 的 区 间 估 计 已 在 (2.27) 式 的 基础 上 求 得 , 帮 问 
题 得 到 解决 . 

6.(a) 取 i==1 来 讨论 , 因为 把 XX ,…,X, 作 线 性 变换 X'; = 


aX, + bla 关 0) 不 影响 (X; - /DN _ 束 )2 之 值 , 不 妨 设 


X =0,Xi=1. 这 时 ， 为 使 上 述 比值 最 大 应 在 X +…+X = 一 1 
的 约束 下 ,使 X5 十 + X2 达到 最 小 .但 易 知 后 者 的 最 小 值 在 


X,=…… = XX, = - 一 -时 达到 ， 最 小 值 为 一 一 故 所 述 比 值 不 能 


大 于 可 +1)=1 一 十 ,等 号 当 且 仅 当 对 菜 个 i, 有 Xi= 
Xi | 二 X41 三 "天 X,. 
(b) 分 两 种 情况 :车 又 ,保持 有 界 , 则 因 S3 -~ oo, 就 有 (a - 


X 小 [Si 一 0. 若 | X.|->oco , 则 注意 到 
(a -总 ,)2/S2 < (a —X, 2/ 2- KX,) ,mn 


固定 区 , 令 2 一 co. 因 为 | X ,| 一 ， 上 趟 右 端 有 极限 1/m. 因 m 
可 取得 任意 大 , 知 (a - X,) 《LSz 的 极限 可 任意 小 , 故 只 能 为 0( 若 
|X | 既 不 有 界 也 不 随 xco 而 趋 于 无 穷 , 则 通过 抽取 子 序列 的 方 
法 去 讨论 ). 

(c) 先 给 出 一 个 预备 事实 :在 [0,1] 上 给 出 三 个 数 zc 一 (0 
CS1) 及 a, 记 I=(x 一 a+(c 一 x 一 ga, 则 总 可 以 改变 工 之 
值 以 增 大 了 ,使 zx,c 开 都 仍 在 [0,1] 上 , 且 工 及 < 一 > 中 至 少 有 一 
个 为 0 或 1. 如 zz 和 c- 并 分 处 a 的 两 边 ,这 一 点 很 清楚 . 若 同 在 一 
连 ,例如 0<xz 委 c 一 zz 委 a, 则 dfvdz=4z--2c<0( 因 过 县 < 一 > 
27z<sc). 故 让 下 降 能 增 大 让 降 为 0( 这 时 c< ->* 升 为 c, 们 
在 [10,1] 上 ) 基 可 . 
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现 证 明 本 题 ,不 失 普 遍 性 可 设 区 间 [A ,B] 为 [0,1]. 证 明 分 三 
段 :1 为 使 3 = > (X 一 久 )? 最 大 , 诸 X 中 至 多 只 能 有 一 个 非 
0 非 1. ,因为 ,车 有 两 个 ,例如 XX ,XX;,; 非 0 非 1. 则 据 上 述 预 备 知 
识 , 可 以 在 不 改变 义 ;,…,X, 和 X 的 条 件 下 ,使 Xi,X， 中 至 少 有 
一 个 为 0 或 1, 而 (Xi 一 六 ?+(X; 一 关 )? 增 大 , 即 S? 增 大 .2° 现 
设 X11,…,XX, 中 ,有 no 个 为 0,ni 个 为 1, 还 有 一 个 为 a ,0 三 a 过 
1. 证 明 : 总 可 以 把 a 改 为 0 或 1 以 增 大 S .此 时 


2 分 7 
. ni 二 a ni++a\ ?71 十 全 
S- 一 zo(0 一 于 二 | + ni (I 一 ) + (a -一 :一 ) 
n 


n 7 
注意 到 no+n1= 二 nn 一 1, 易 算出 
d(S’)/da = 2(n -1)n la+D 
DD 与 a 无关 , 奋 上 式 大 于 0, 则 把 a 增 至 1 可 增 大 S; 若 上 式 不 大 
于 0, 则 把 a 减 至 0 可 以 增 大 S .总 之 ,a 可 改 为 0 或 1 以 增 大 
S*.3" 以 上 两 步 证 明了 :为 使 S 最 大 ,全 部 X 必须 只 取 0,1 这 两 
个 值 , 设 有 no 个 0,xi 个 1. 则 


2 
S*” = no(0- 十 ni [1 一 = nony/n 


在 170 十 11 一 扩 的 约束 下 ,要 使 S”* 最 大 ， no 和 nl 之 差距 应 尽量 
小 ,如 4 二 2m ,应 取 no 三 4] 二 :大 n= 二 2m 十 1, 则 nosn1 中 应 有 
一 个 为 m ,为 一 个 为 m+1. 


7.(a) 由 Bo= Y 易 得 出 E(Bo)= By, 为 证 E(B)=B, 暂 把 p 
行 n 列 方 阵 上 -1X 记 为 


tn LD | 


Lp1 /22 机 Lp ) 
从 XX 的 每 行 元 素 之 和 为 0, 可 推出 此 和 矩阵 每 行 元 素 之 和 为 0:2 + 
0=1,，… 力 . 现 有 


n n Pp 上 
E(B;) = E( 2 liY:)= 2 lBo + > Be > UiXe 
i= i=1 -1 i=1 
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据 上 述 ,Bo 之 系数 为 0, 而 B 之 系数 , 正 是 两 矩阵 上 "XX 和 X 之 
积 的 (j,k) 元 , 因 上 1XX = 上 iL= 单 位 阵 1, 知 只 有 当 上 =; 时 


此 系数 为 1 ,k 为 其 他 值 时 为 0. 故 证 明了 E(B)=B,j=1,…,p. 


(b) 因 为 了 = 二 (Yi + 二), 记 = Yit+ + WY 由 
(Y1,…,Y; ) 独 立 且 由 等 方差 , 易 知 

Cov( Bo,B;) 一 02 十 “十 {in ) 一 0,7 二 1 ,…,p. 

(c) 与 (b) 相 似 ,由 B; = LY1++… 二 laY, 及 B = a Yi+ + 
YY. 得 知 


Cov(B;,B;) 一 og” (Liljl 十 ”十 Linlin ) 
右边 括号 内 之 量 是 矩阵 L-'X 及 其 转 置 之 积 的 (i,j) 元 . 因 上 为 
对 称 方 阵 , 故 二 一 也 是 对 称 方 阵 , 即 (二 1)=L1. 故 (L-!1X): 


(L IX)=L IXXL -LI=LTILL != 上 1 因此 ,Cov(8 ,8)= 


LL-! 的 (i ,元 , 当 i=j 时 ,得 到 名 的 方差 . 
8. 有 关 的 理论 考虑 在 题 中 已 说 了 . 现在 只 须 计 算 一 下 


TY 1 一 盖 : 记 S2 = Dx, - 部 ) 并 注意 (X - X ) 
i=1 i=1 


‘(Y,—- Y)= D(X- 多)Y,, 有 


r Vn -2 We WY |s, /wz 


Vl-r (1- Px, - X)Y /1(sS > (y - 立 )2) 


三] 


并 


(PY; FF- (DX XY )/S2)'? 
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1(Y, -YP- (Sx -XY) /SS) /V2, 而 


3 = NOX -又 )Y,/S2, 又 Bl = 0. 故 即 有 


再 用 (2.26), 即 证 得 所 要 的 结果 . 

9.(a) 令 2 = YY; 一 ,i 二 1,…,n,Z1,…2n 独立 同 分 布 , 公 
其 分布 为 N (5 一 a,20*). 而 Ho:b6 二 a 成 为 一 个 检验 正 态 分 布 
N(0,02)(o?=20?,0=6 一 a) 中 均值 6=0 的 问题 ,可 用 一 样本 : 

= 1 站 > 
eA DA 
时 否定 Ho. 

注 : 这 个 模型 叫做 “成 对 比较 模型 ", 意 即 X;,Y; 这 一 对 可 以 
比较 ,但 当 i 关 ; 时 , X;, Y 无 法 比较 ,因为 Yi 一 Xi 一 NO 一 CT 
dj- 一心 ,2c), 不 只 与 5-& 有 关 而 dj; 一 d; 又 不 知道 .这 与 所 谓 成 
组 比较 "不同: 在 成 组 比较 模型 中 是 4d|==…= 4d, ==0. 这 时 任意 的 
X;,Y; 都 可 比较 ,而 我 们 可 使 用 两 样本 1 检验 去 检验 Ho, 它 有 
2n 一 2 个 自由 度 . 而 检验 (4) 只 有 nn 一 1 个 自由 度 ,所 损失 的 自由 
度 ,就 是 因为 有 了 赣 余 参数 41,，… ,qd 

(b) 可 以 把 1 入) 和 1 Y, 分 别 视 为 一 个 两 水 平 因 
素 在 其 水 平 1 的 7 个 观察 值 和 水 平 2 的 ?2 个 观察 值 .di 为 区 组 效 
应 ,j= 二 1,…,n, 而 a ,6 则 分 别 是 这 两 个 水 平 的 效应 .为 把 模型 写 
成 (5.13) 的 形式 ,可 令 Y1;= X,Y 二 Yj,j 二 1,…,n ;而 

n=d+(at+6)/2 (dg = (dit+*d,)/n) 
a =a-(a+6)/2,ar9 ~=b-(at+b)/2 
p= di ,j= 1,,n 
则 有 
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Yiy = K+tat+b;+es,?i=1,2;7] = 1 (9) 
这 里 cijyz 三 1257 二 1， “sn 全 体 独 立 同 分 布 并 有 公共 分 布 N (0， 


22) .模型 (5) 符 合 所 要 求 的 约束 条 件 ; 
a1t+a =a-(a+6b)/2+6b6-(a+6b)/2=0 


D5 = Dd- 2)-0 
原 假设 : Ho:a = 6 相应 于 检验 (5) 中 的 因子 效应 为 0, 即 ww- 


0. 
(c) 束 模型 (5) 按 (5.23) 的 分 解 式 来 计算 SSa。 和 SS,: 


2 n 
SS = 2 2 (Y; 一 Yi ~ Y ;+ Y..) 


= DH)/24 (RY) /2 
+ DY,- Y —-(X+Y)/2+(X+ YF)/27 
= > [(X -YY)/2- (XY)/ 2 
+ DY X)/2 (FR)/2T 
= OZ- 2 (2 = YX) 
自由 度 为 (2 一 1)(n 一 1) = 一 1. 而 
2 
SS4= a (YY =al(R- (N+Y)/2) 


+(Y—-(X+ YY)/2)) 


2 
-1=1. 故 Ho:aj=as=0, 即 a=6 的 下 检验 为 . 当 
21 D2 27/n -D> 本 ia 
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时 否定 Ho, 即 当 
A 172 
[i121 (ss 27) >VFrie) 


时 否定 Ho. 由 于 六 _1(a/2)= Fl _1(Q)( 这 是 因为 , 按 定 义 , 帮 
| XX 一下, _1) ,这 个 检验 与 (a) 中 得 到 的 一 致 

这 张 正 交 表 叫 Ls(27 站 ) 正 交 表 . 它 只 能 排 2 水 平 因子 ,至 多 
7 个 定做 8 次 ,不 能 多 也 不 能 少 . 

把 因子 A ,B,C 分 别 排 在 第 1,2,4 列 头 上 ,区 组 也 视 为 一 
因子 DD , 排 在 第 $ 列 头 上 , 则 得 到 如 下 的 设计 : 

区 组 1:4;BICi,A1B;C ,ABC ,ABC，， 

区 组 2:A;B1iC, ,ABC ,ABC ,ABCI， 

其 中 例如 ,4A1B2C; 表示 因子 A 取水 平 1,B 取水 平 2,C 取 
水 平 1, 余 类 推 . 

其 所 以 舍 掉 第 3 列 不 用 ,是 为 了 避免 某 些 组 合 做 两 次 (如 
AiBiCi 等 ), 而 某 些 组 合 (A1B;Ci 等 ) 则 不 出 现 , 按 上 述 设计 , 则 
8 种 可 能 的 组 合 各 出 现 了 一 

此 设计 A,B,C 及 区 组 各 占 一 自由 度 , 共 4 个 自由 度 .全 部 自 
由 度 为 8-1=7, 故 误差 平方 和 SS, 尚 有 三 个 自由 度 . 
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附 表 
1. 标准 正 态 分 布 表 


本 表 列 出 了 标准 正 态 分 布 函数 (x) = (V 阮 ) | edt 


当 0 牵 xz 过 2.98 之 值 .此 范围 内 不 能 直接 查 出 之 值 ,可 用 线性 插值 
法 .对 过 < 0 可 用 G@G(z)=1-@6(-，x) 化 为 zx > 0 的 情况 . 


0.0 0.5000 0 .5030 0 . 0.5319 
0.1 0.5398 0.5478 0 . 0.3714 
0.2 0.3793 0.53871 0. 0.6103 
0.3 0.6179 0.62355 0 . 0 . 0.0480 
0.4 0.6554 0.6628 0. 0 . 0.6844 
0.,5 0.6915 0.6985 0. 0. 0.7190 
0.6 0.7237 0.7324 0 . 0 . 0.7517 
0.7 0.7380 0.7642 0. 0. 0.7823 
0.8 0.7881 | 0.7939 0 . 0 . 0.8106 
0.9 0.8139 0.8212 0. 0. 0.8365 
1.0 0.8413 0.8461 0. 0. 0.8599 
1,1 0 .8643 0.8686 0. 0. 0.8810 
] .2 0.8849 0.8888 0 . 0 . 0.8997 
1.3 0.90320 0.90658 0. 0. 0.91621 
1,4 0.91924 0.92220 0 . 0. 0.93056 
1.5 0.93319 0.93574 0. 0. 0.94295 
1.6 0.944270 0.94738 0 . 0 . 0.95352 
1.7 0.95543 0.93728 0 . 0 . 0.96246 
] .8 0 .90407 0.96362 0 . 0 . 0 .96995 
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7 0.04 0.06 0.08 

1.9 0.97128 . 0.97381 0.97300 0.97013 
2.0 0.97725 0.97932 0.98030 0.98124 
2.] 0.98214 0.98382 0.98461 0.98337 
2.2 0.98610 0.98745 .0.98809 0.98870 
2.3 0.98928 0.99036 0.99086 0.99134 
2.4 . 0.99180 0.99266 0.99305 0.99343 
2.5 0.99379 . 0.99446 0.99477 0.99506 
2.6 0.99334 0.99586 0.99609 0.99632 
2.7 0.99653 0.99693 0.99711 0.99728 
2.8 0.99745 0.99774 0.99788 0.99801 
2.9 0.99813 0.99836 0.96846 0.99856 


2. 标准 正 态 分 布 双 侧 上 分 位 点 u， 表 


本 表 列 出 满足 条 件 P(X| 宇 up)=a 的 wb, 其 中 义 服从 
标准 正 态 分 布 . 


a 0.2 0.3 
0.00 1.6449 | 1.2816 1.0364 0. 

0.01 2.5758 1.5982 1.2536 1.0152 0.8239 
0.02 2.3268 1.5548 1.2265 0.9945 0.8064 
0.03 2.1701 1.5141 | 1.2004 0.9741 0.7892 
0.04 2.0537 1.4758 1.1750 | 0.9542 0.7722 
0.05 1.9600 1 .4395 1.1503 0.9346 0.7554 
0.06 1.8808 1.4051 1.1264 0.9154 0.7388 
0.07 1.8119 1.3722 1.1031 0.8965 0.7225 
0.08 1.7507 1.3408 1.0808 0.8779 0.7063 
0. .0581 0.8596 0.6903 
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3. 分 布 上 侧 分 位 点 z, (x ) 表 


设 随机 变量 X 服从 自由 度 为 n 的 上 分 布 ,本 表 列 出 满足 条 件 
P(X>t,(a))=a 的 值 i(a). 
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4. 普 阿 松 分 布 表 P(X = 7)=e 


0 .44932 
1 .35946 
2 .14378 
3 .03834 
4 .00766 
5 .00122 
6 .00016 
7 .00001 
8 .00000 
, 
4.0 

0 .01831 
1 .07326 
2 .14652 
3 .19536 
4 .19536 
> .15629 
6 .10419 
7 .05954 
3 .02977 
3 .01323 
10 .00529 
li .00192 
12 .00064 
13 .00019 
14 . 00005 
lS .00001 
16 .00000 
17 . 00000 
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5. 卡 方 分 布 上 侧 分 位 点 Xx%(a) 表 


设 随 机 变量 X 服从 自由 度 为 n 的 卡 方 分 布 ,本 表 列 出 满足 条 
件 P(X>x%(a))=a 的 值 x%(a). 


On 一 


tf 一 所 


14 
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6. 下 分布 上 侧 分 位 数 忆 (cx) 表 


设 随机 变量 X 服从 自由 度 为 m 和 nn 的 下 分 布 ,本 表 列 出 满 
是 条 件 P(X>F,,,(a)=a 的 值 忆 (ay). 


0 


10 48 
11 36 
12 26 
13 18 


本 并 六 请 上 上 本 上 上 om an ~、 


on\ 
心 
PPnhbhbhbnhbhhbibhbhbibhihbibibibmmmmmmhh Co 


Rbhbhbhbhhbhbhhbhhbhibhbibhbmmmummbwmwmwmmhvmawmw 
‘DD 
个 
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~ 3 om oo 
em 
[BD 


A 人 
dk 
pk 


人 人 


99.2 | .99.3 
28.7 | 28.2 ， 
160 1 
11.4 | 11.0 
9.15 | 8.75 
7.85 | 7.46 
7.01 | 6.63 
6.42 | 6.06 
5.99 | 5.64 
5.67 | S.32 
5.41 | 5.06 
5.21 | 4.86 
5.04 | 4.70 
4.89 | 4.56 
4.77 | 4.44 
4.67 | 4.34 
4.58 | 4.25 
4.50 | 4.17 
4.43 | 4.10 
4.37 | 4.04 
4.31 | 3.99 
4.26 | 3.94 
4.22 | 3.90 
4.18 | 3.86 
4.14 | 3.82 
4.11 | 3.78 
4.07 | 3.75 
4.04 | 3.73 
4.02 | 3.70 


Nn 
Cy 
~ 


二 全 全 所 请 和 
人 


人 人 


